Mam plik indeksu Solr/Lucene o wartości około 700 Gb. Dokumenty, które muszę indeksować, są odczytywane w czasie rzeczywistym, z grubsza 1000 dokumentów co 30 minut i muszą być indeksowane. W moim scenariuszu skrypt jest uruchamiany co 30 minut, który indeksuje dokumenty, które nie są jeszcze indeksowane, ponieważ jest to wymaganie, aby nowe dokumenty były dostępne do przeszukiwania tak szybko, jak to możliwe, ale proces ten spowalnia wyszukiwanie.Najlepszy sposób na utrzymanie indeksu w czasie rzeczywistym?
Czy to najlepszy sposób na zindeksowanie najnowszych dokumentów lub istnieje inny lepszy sposób!
Aktualizacja: Solr ma teraz (prawie) możliwości wyszukiwania w czasie rzeczywistym. – mt3
@ mt3 link, aby uzyskać więcej informacji? – Simon
@Simon Przepraszamy za opóźnioną odpowiedź. Jest w bagażniku oddziału Solr/Lucene. http://wiki.apache.org/solr/NearRealtimeSearch – mt3