Możemy powiedzieć botom, aby przeszukiwały lub nie indeksują naszej witryny w robocie.txt. Z drugiej strony możemy kontrolować szybkość indeksowania w Google Webmasterzy (ile Google bot indeksuje witrynę). Zastanawiam się, czy możliwe jest ograniczenie aktywności robotów przez robots.txtCzy można kontrolować prędkość indeksowania przez plik robots.txt?
Mam na myśli akceptowanie botów do indeksowania stron, ale ograniczanie ich obecności do czasu, stron lub rozmiaru!
Ostatnio słyszałem, Googlebot ignoruje Crawl-delay, więc nie będzie to faktycznie pomoc dla Google. Will jednak dla kilku innych botów. Bez informacji o tym, dla których robotów działa, ta odpowiedź jest raczej niekompletna. – derobert
Więcej informacji na temat 'Crawl-Delay' można znaleźć w odpowiedzi na to pytanie: http://stackoverflow.com/questions/17377835/robots-txt-what-jest-profil -format-dla-dla-dla-dla-multiple -user-agent –
Opóźnienie indeksowania nie jest częścią standardu, ale niektóre boty go szanują: https://en.wikipedia.org/wiki/Robots_exclusion_standard#Crawl-delay_directive – nmit026