Znalazłem to na Lucene za Similarity
klasy public float idf(Term term, Searcher searcher)
metoda javadoc:Dlaczego Lucene używa maxDoc zamiast numDocs do obliczenia terminu idf?
Uwaga że Searcher.maxDoc() jest używana zamiast IndexReader # numDocs() dlatego też Searcher.docFreq (Term) jest używany, oraz gdy ostatnie jest niedokładne, tak samo jak Searcher.maxDoc() i jest w tym samym kierunku. W dodatku , funkcja Searcher.maxDoc() jest bardziej wydajna do obliczenia.
To nie ma dla mnie większego sensu. Czy ma to coś wspólnego z usuwaniem dokumentów w IndexReader?
Wydaje się, że odpowiedziałeś sporo z moich pytań. Dziękuję Ci :-) – Denzel