Który z pakietów open-source najlepiej nadaje się do grupowania dużego zbioru dokumentów? Powinien albo sam decydować o liczbie klastrów, albo może to zaakceptować jako parametr.Jaki jest najlepszy pakiet open source do klastra?
Mamy duży zbiór dokumentów, które tak naprawdę nie koncentrują się na konkretnym temacie - są dokumentami tworzonymi przez sprzedawców i kierowników różnych projektów i klientów w organizacji. Wiem, że posiadanie takiego rozproszonego korpusu obniży wydajność, ale staramy się żyć z najlepszymi, jakie możemy uzyskać. Teraz, co jest najlepsze, co możemy dostać :-)
Cześć, ma coś zmieniła się dramatycznie w międzyczasie? Znalazłem to fajne narzędzie: https://code.google.com/p/maui-indexer/ – Kiril