2010-06-29 10 views

Odpowiedz

5

Heritrix to robot sieciowy open-source napisany w języku Java. Przeglądając ich javadoc, widzę, że mają one klasę narzędziową Robotstxt do parsowania pliku robots.txt.

+0

W robocie plikstxt występuje błąd. Proszę go nie używać. Zmarnowany dużo czasu. Do takiego pliku: User-agent: * Disallow:/ AllowAll metoda Robotstxt mówi "true". – 10101010

1

Istnieje również jrobotx library hostowany na SourceForge.

(Pełne ujawnienie: I wydzielona kod, który tworzy tę bibliotekę.)