Czy można wyodrębnić listę wszystkich terminów w indeksie Lucene jako listę łańcuchów? Nie mogłem znaleźć tej funkcji w dokumencie. Dzięki!Znajdź listę terminów zindeksowanych przez Lucene
Odpowiedz
Lucene 3:
Java:
IndexReader indexReader = IndexReader.open(path); TermEnum termEnum = indexReader.terms(); while (termEnum.next()) { Term term = termEnum.term(); System.out.println(term.text()); } termEnum.close(); indexReader.close();
Java (wszystkie terminy dla konkretnej dziedziny): How can I get the list of unique terms from a specific field in Lucene?
Python: Finding a single fields terms with Lucene (PyLucene)
W Lucene 4 (i 5):
Terms terms = SlowCompositeReaderWrapper.wrap(directoryReader).terms("field");
Edit:
To wydaje się być 'poprawny' sposób teraz (Lucene 6 i więcej):
LuceneDictionary ld = new LuceneDictionary(indexReader, "field");
BytesRefIterator iterator = ld.getWordsIterator();
BytesRef byteRef = null;
while ((byteRef = iterator.next()) != null)
{
String term = byteRef.utf8ToString();
}
Zakładając, że nazwa pola to '" field ". 'W Jackrabbit jest to' "_: FULLTEXT".' – EJP
@Rob Au 'SlowCompositeReaderWrapper' jest teraz przestarzałe w wersji 6.1.0. Czy wiesz, jak to zrobić w 6.4.1? – Sundeep
Zespoły Lucene wydają się mieć bardzo zły zwyczaj deprecjonowania rzeczy bez aktualizacji Javadoc, aby wskazać ludziom nowe sposoby i metody! – Robert
- 1. Drupal 7 otrzymasz listę terminów dotyczących taksonomii w widokach
- 2. Złożoność wyszukiwania Lucene
- 3. Lucene: porównaj wyniki dla zapytań
- 4. ElasticSearch agregacja terminów
- 5. Podświetlanie Solr wielu terminów
- 6. Jak mogę wyszukać listę wartości za pomocą Solr/Lucene?
- 7. Znajdź listę publicznych obrazów rejestru kontenerów Google
- 8. Znajdź żądania ściągnięcia połączone przez określonego użytkownika
- 9. Znajdź przez wiele atrybutów XML
- 10. Porównaj podobieństwo terminów/wyrażeń używając NLTK?
- 11. Algorytm NLP do "wypełniania" wyszukiwanych terminów
- 12. lucene/python
- 13. Synonimy za pomocą Lucene
- 14. Elasticsearch zapytań Lucene w grafana
- 15. ZAMÓW PRZEZ listę wartości IN
- 16. Jak filtrować listę przez EditText
- 17. Porównanie wydajności między Zend Lucene i Javą Lucene
- 18. Lucene jako magazyn danych
- 19. Precyzyjne przywoływanie w lucene java
- 20. Zdobądź częstotliwości w Lucene
- 21. Różnica terminów xaml używanych do wiązania
- 22. Znajdź listę nieudanych zadań Sidekiq z ich argumentami
- 23. MongoDB: Znajdź dokument przez nieistnienie pola?
- 24. Znajdź lub utwórz rekord przez stowarzyszenie factory_girl
- 25. Znajdź wszystkie aktualne linie zmodyfikowane przez autora
- 26. Znajdź zatwierdzenie przez haszowanie SHA w Git
- 27. Znajdź elementu przez ios_ui nie działa
- 28. Znajdź element przez XPath, która zawiera tekst
- 29. Znajdź wartość w Json przez javascript
- 30. Znajdź maksymalną wartość w tablicy przez rekursję
To nie działa dla Lucene 4.0.0 ... – RobAu