Co to jest najlepsze narzędzie Crawler sieci Web Open Source napisane w języku Java?

Co to jest najlepsze narzędzie Crawler sieci web Open Source, napisane w języku Java.Co to jest najlepsze narzędzie Crawler sieci Web Open Source napisane w języku Java?

Źródło

2011-12-12 cuneytykaya

Spróbuj crawler4j. Jest otwarte i łatwe w użyciu. Możesz polecić ten przewodnik konfigurowania crawler4j - http://www.buggybread.com/2013/01/create-your-own-email-and-image.html –

Wypróbuj crawler4j. Wystarczy zaimplementować prosty interfejs, który kontroluje, które adresy URL odwiedzić i co zrobić z każdą zindeksowaną stroną.

Źródło

2011-12-12 12:20:46 Andy

Mam problemy z indeksowaniem stron HTTPS przy użyciu tego robota ("witryna nie odpowiada ", gdy otwiera się dobrze w przeglądarce itp.) – ed22

w języku Java Myślę, że sprowadza się do Nutch vs Heritrix. Powinieneś określić, jakie są twoje potrzeby, aby uzyskać lepszą odpowiedź.

Źródło

2011-12-12 12:20:03 riffraff

Co to jest najlepsze narzędzie Crawler sieci Web Open Source napisane w języku Java?

Odpowiedz

Powiązane problemy