Chciałbym użyć tuleja do łączenia liczb słów.
http://snowball.tartarus.org/download.html
strona ma link do pobrania, ale nie jestem pewien, jak zintegrować pliki do mojego projektu Eclipse
jej nie tylko jar spadać w moim folderze lib, jego systemu plików. Czy ktoś wie o jakiejś dokumentacji wyjaśniającej to, ponieważ nie widziałem żadnych na stronie internetowej.
(W jaki sposób mogę importować, jak to nazwać itd.)Użytkowanie Snowball Stemmer
Odpowiedz
Zbuduj plik jar i dodaj go do ścieżki budowy.
Szczegóły:
- pobrać tgz z kodem stąd http://snowball.tartarus.org/download.php
- Rozpakuj.
- Przejdź do katalogu libstemmer_java i przeczytaj README.
- Postępuj zgodnie z instrukcjami, aby skompilować (używając javac).
- Być może trzeba będzie poprawić lub usunąć java/org/tartarus/snowball/ext/frenchStemmer.java, ponieważ ma błąd i nie kompiluje się.
- Tworzenie pliku jar: Przejdź do libstemmer_java katalogu/java następnie słoik cvf libstemmer.jar *
- Dodaj libstemmer.jar do ścieżki budowlanej (w Eclipse: Project-Właściwości-Java Build Path-Libreries Tab).
Następnie można użyć stemmery Uprawiając jak:
import org.tartarus.snowball.ext.spanishStemmer;
...
spanishStemmer stemmer = new spanishStemmer();
stemmer.setCurrent("torero");
if (stemmer.stem()){
System.out.println(stemmer.getCurrent());
}
Wpadłem na błąd kompilacji, więc wyjąłem wszystkie paczki z językiem angielskim, a kompilacja poszła idealnie. Dziękuję za odpowiedź na to pytanie i nie mówienie komuś o RTFM. :) – Twitch
Mam nietypowy problem. Mam ciąg w zmiennej o nazwie "word", jak word = "torero"; a kiedy przekażę tę zmienną do łodygi, nie zadziała. np. stemmer.setCurrent (słowo); stemmer.stem(); System.out.println (stemmer.getCurrent()); .Nie będzie się wywodzić. powiedz mi, co robię źle tutaj. –
- 1. Snowball Stemmer wywodzi tylko ostatnie słowo
- 2. Plany kolby właściwe użytkowanie
- 3. WebClient strona użytkowanie z poświadczeniami
- 4. Które słowo stemmer powinienem użyć w Nltk?
- 5. Instalacja i użytkowanie SmartGit na Ubuntu
- 6. Android MVP: bezpieczne użytkowanie Kontekst w Presenter
- 7. Próbując zainstalować Jekyll na Windows 8 (x64): Błąd instalacji szybko stemmer-1.0.2.gem
- 8. W języku Python, czym jest podkreślenie przed zmienną instancji?
- 9. Jak mogę pobrać tylko pasujące dzieci?
- 10. Fuzzy String Matching with Rails (Tire) i ElasticSearch
- 11. Ograniczenia dla iPhone beta OS
- 12. Elasticsearch z analizatorem śnieżki zwraca jedynie wyniki dla wynikała słowa
- 13. DefaultParser w Apache Commons CLI
- 14. Visual Studio warning C4133
- 15. Klient HTTP apache http - przykłady użycia pokazujące użycie plików cookie i wyodrębnianie odpowiedzi z obiektu HTTPResponse
- 16. WiX - przekazywanie parametrów do CustomAction (DLL)
- 17. Poczekaj na Async w interfejsach API dostępu do sieci Windows Phone
- 18. Jak wyróżnić tokeny ngram w słowie za pomocą elastycznego wyszukiwania
- 19. ElasticSearch - Wyszukiwanie łącznikami w nazwie
- 20. Jakieś dobre biblioteki C lub C++ do obsługi dużych chmur punktów?
- 21. Użycie argv w C?
- 22. Jakie są zalety korzystania z klasy częściowej w przeciwieństwie do abstrakcyjnej?
- 23. Używanie gontów i słów zatrzymanych za pomocą Elasticsearch i Lucene 4.4
- 24. Elasticsearch szyny/Elasticsearch Modelarski wyszukiwania stowarzyszenie
- 25. Custom Analyzer elasticsearch-rails
- 26. Unikanie @ własności-itis (tj. Nadużywanie właściwości, jeśli są one odpowiednie)?
- 27. Postgresql wyszukiwanie pełnego tekstu tokenizer
- 28. Tryby otwartego strumienia plików C++
- 29. dokumentowanie zestawu danych z roxygen2
- 30. Informacje o mechanizmach debugowania używanych przez debugger
[śnieżki manualny] (http://snowball.tartarus.org/compiler/snowman.html) i [śnieżki jak na uruchom go] (http://snowball.tartarus.org/runtime/use.html) – orangegoat
Czytałem oba te, ale drugi mówi, jak uruchomić go samodzielnie z Java, a nie jak importować do projektu i pierwszy nie dotyka rzeczywistej konfiguracji – Lemonio