Chcę wiedzieć, jak przeanalizować plik robots.txt w języku Java.parser robots.txt java
Czy istnieje już jakiś kod?
Chcę wiedzieć, jak przeanalizować plik robots.txt w języku Java.parser robots.txt java
Czy istnieje już jakiś kod?
Istnieje również jrobotx library hostowany na SourceForge.
(Pełne ujawnienie: I wydzielona kod, który tworzy tę bibliotekę.)
Jest też nowa wersja robotom Gmin:
https://github.com/crawler-commons/crawler-commons
Biblioteka ma na celu wdrożenie funkcjonalności wspólne do dowolnego robota sieciowego i zawiera bardzo przydatny parser robots.txt.
W robocie plikstxt występuje błąd. Proszę go nie używać. Zmarnowany dużo czasu. Do takiego pliku: User-agent: * Disallow:/ AllowAll metoda Robotstxt mówi "true". – 10101010