Potrzebuję porównać trafność wyników wyszukiwania w różnych zapytaniach Lucene.Lucene: porównaj wyniki dla zapytań
Właściwie mam zestaw dokumentów zindeksowanych i kiedy wyszukiwanie jest wykonywane na tym zestawie, chcę zwrócić nie N najlepsze wyniki z tego zestawu, ale wszystkie wyniki, które pasują do zapytania "wystarczająco dobre".
Parametr "wystarczająco dobry" będzie konfigurowalny (powiedzmy między 0 (dokument jest absolutnie nieistotny) a 1 (dokument jest najlepszym możliwym dopasowaniem)), ale chcę, aby wpływał on na wszystkie zapytania w ten sam sposób.
Z tego, co znalazłem w Internecie, nie jest to proste zadanie. Czy ktokolwiek może mi podpowiedzieć, jak podejść do tego problemu?
Wielkie dzięki!
Nie jesteś pewien co masz na myśli? Czy chcesz zawęzić wyniki zapytania? Łatwo to zrobić z Solr. Z Lucene musisz napisać niestandardowy kolektor: zobacz tutaj http://stackoverflow.com/questions/2871558/remove-results-below-a-certain-score-threshold-in-solr-lucene – Mikos
Dzięki Mikos, ale jak to jest napisane w komentarzu Shashikant Kore tam, wyniki są w stosunku do zapytań, a więc nie mogę użyć tego samego progu do pomiaru "dobroci" wyników w wielu zapytaniach. Patrzę w sposób normalizacji wyników w jakiś sposób, aby te znormalizowane wartości oznaczały to samo pod względem "dobroci" dla wszystkich zapytań. – Serpenty
ahh! Myślę, że lepiej rozumiem twoje pytanie, ale uważam, że bardziej nadaje się do statystyk niż Lucene per se. Może zajść potrzeba sprawdzenia statystyki ANOVA lub Chi-kwadrat w statystykach, a także może pomóc w ustaleniu dopasowania dopasowania między zapytaniami za pomocą tablicy wyników dokumentu wynikowego. HTH. – Mikos