Widzę różne kombinacje wersji Nutch i Solr używane przez osoby publikujące na ten temat w Internecie. Jakie są najnowsze stabilne (nie beta) i kompatybilne wersje Nutch i Solr, które mogę pobrać i skonfigurować bez budowania źródeł i po prostu konfigurowania?Najnowsze kompatybilne wersje Nutch i Solr
Odpowiedz
Możesz użyć Nutch 2.1 lub Nutch 1.6. Jeśli chcesz używać HBase, musisz użyć Nutch 2.x. Ponieważ Nutch 1.6 nie obsługuje Hbase. Używam nutch 2.1, HBase 0.90.x lub 0.94.5 i Solr 4.3.0.
Istnieją poważne zmiany między dwiema wersjami Solr (Solr 3.x i Solr 4.x). Musisz wybrać jedną z nich zgodnie z wymaganiami. Np: lepiej Solr4 support cloud
.
Z jakiego systemu operacyjnego korzystasz?
W systemie Windows Nutch 1.2 była najnowszą wersją, którą udało mi się uzyskać.
W systemie Linux Nutch 1.6 działa bardzo dobrze z SOLR.
To było w połączeniu z SOLR 3.5 (z powodu innych zależności), ale nie ma powodu, aby nie działał z SOLR 3.6 lub 4.3.
I wdrożone nutch 1.6 i Solr 3.6.2 do systemu produkcyjnego na początku tego roku w dużej firmie finansowej. Działają bardzo dobrze razem.
użyłeś Tomcat lub Jetty dla Solr? – MarioCannistra
Użyłem obu, aw obu przypadkach są one proxy przez Apache. – Claude
Cześć Claude. Czy kiedykolwiek próbowałeś Nutch 2.2.1 z HBase w systemie produkcyjnym? – sunskin
Oto kilka sugerowanych kompatybilne wersje Nutch i Solr w oparciu o to, co twórcy w nutch są ogłoszeniu na ich stronie internetowej here:
+-------+--------+
| Nutch | Solr |
+-------+--------+
| 2.3.1 | 4.10.3 |
| 2.3 | 4.8.1 |
+-------+--------+
Zapraszam do dodawania kolejne wersje. Narzędzie używane do wygenerowania tej tabeli można znaleźć here.
używam -
- Apache nutch 2.3.1
- Solr 5.2.1
- HBase 0.94.14
A to połączenie działa poprawnie!
- 1. Integracja Apache Nutch i Solr
- 2. Bundler nie mógł znaleźć kompatybilne wersje gem
- 3. Nutch komunikat „Brak IndexWriters aktywna” podczas ładowania do SOLR
- 4. Nutch: Dane odczytują i dodają metadane
- 5. Scrapy Vs Nutch
- 6. Czy Bootstrap 3 i Boostrap 4 - wersje alpha są obecnie kompatybilne wstecz?
- 7. Wtyczka "wersje" Mavena - jak wykluczyć wersje alfa/beta z odpowiedzi?
- 8. W jaki sposób tworzymy prostą wyszukiwarkę za pomocą Lucene, Solr lub Nutch?
- 9. Hasło hashujące kompatybilne z Javą i PHP
- 10. Jak przedłużyć Nutch do indeksowania artykułu
- 11. nutch ścieżka 1,10 wejściowy nie istnieje/linkdb/prąd
- 12. Nutch-Cygwin Jak ustawić JAVA_HOME
- 13. TeamCity 7.0 Zależność i wersje
- 14. Crawling użyciu nutch ... Pokazuje IOException
- 15. pobierz N najnowsze zapisy
- 16. Enumerate JumpList najnowsze pliki?
- 17. Najnowsze narzędzia ADT i sdk zainstalowane, ale wciąż pytające o najnowsze narzędzia sdk
- 18. indeksowania Pola SOLR i LowerCaseFilterFactory
- 19. Solr 4.4: StopFilterFactory i enablePositionIncrements
- 20. Skąd pobrać starsze wersje Xcode?
- 21. Metody rozszerzeń do przodu kompatybilne
- 22. Urządzenia kompatybilne z Mocha obsługują
- 23. Najnowsze rekord w lewo dołączyć
- 24. Nutch na odczyt problemu EMR z S3
- 25. Wiosna pliki konfiguracyjne i określające wersje schematu
- 26. Graj! i Spark niekompatybilne wersje Jackson
- 27. Różne wersje Netty i ich cele
- 28. Jak odczytywać urządzenia i wersje sterowników
- 29. Wersje Bootstrap i kompatybilność z przeglądarką
- 30. Odzyskiwanie najnowsze rekordy w kwerendzie
Używam Ubuntu Server 12.04 LTS. Po prostu próbowałem SOLR 4.3.0 i Nutch 1.6. Oba działają (Solr działający w Tomcat i Nutch pomyślnie przeszukał małą witrynę). Po uruchomieniu polecenia solrilindex Nutch w celu zintegrowania ich i indeksowania przeszukiwanej witryny za pomocą solr, otrzymałem zadanie java.io.IOException Job nie powiodło się! błąd. Brak dalszych szczegółów w dziennikach solr lub nutch. Zastanawiam się, czy może to wynikać z niekompatybilności między dwiema wersjami ... – MarioCannistra
Wersja Tomcat to 7 – MarioCannistra
Plik hadoop.log zwykle zawiera więcej szczegółów. Czy możesz opublikować ślad stosu błędu? Jeśli nie ma więcej szczegółów, spróbuj zmienić conf/log4j.properties i zmienić poziomy debugowania z INFO na DEBUG – nimeshjm