2012-08-07 10 views
9

Robię przegląd różnych bibliotek i systemów dla aplikacji NLP. Szukam tych, których przegapiłem. Lista, z którą zacząłem, rośnie, więc jestem pewien, że jest tam więcej. Oto, co znalazłem do tej pory.Jakie biblioteki oferują podstawowe lub zaawansowane metody NLP?

Niektóre z nich to Open Source, a niektóre są nie. Każdy ma kompromisy. Myślę, że jestem skłonny do bibliotek, które dają mi większy dostęp do podstawowych funkcji NLP (na przykład, chciałbym na przykład spojrzeć na rzeczywiste znaczniki POS).

Więc, za czym tęskniłem? Czego używasz lub czego preferujesz? Dzięki!

+0

Dzięki unutbu do linków URL. Powinienem dodać więcej, ponieważ są one ogólnie użyteczne dla wszystkich. –

+0

Słyszałem, że istnieje gałąź NLTK 3.0 na GitHubie, ale już jej nie ma. Jakieś słowo na ten temat? Używałem NLTK 2 w wielu projektach, ale z tak dalekim opóźnieniem w przenoszeniu do Pythona 3.x nie mogę go polecić dla niczego innego niż eksperymentowanie. –

+0

http://text-processing.com/ – alvas

Odpowiedz

4

Kilka więcej:

także sprawdzić tę Artykuł Wikipedii: List of natural language processing toolkits

+0

Ten artykuł wikipedii był bramą do wszelkiego rodzaju innych rzeczy. Bardzo to doceniam. Apache UIMA jest świetnie wyglądającą strukturą, zwłaszcza że istnieją dobrze zdefiniowane sposoby na to, aby działała z Hadoop. –

1

Kolejny że to haniebne pominięcia jest LinguaSys który moja przyjaciółka Meta Brown pracowała dalej!

1

Apache UIMA to kolejna, której brakowało mi podczas pierwszego przejścia i jest w artykule na Wikipedii. Jest całkiem niezły, posiada certyfikat OASIS i miliard użytecznych narzędzi. Nie wiem, jak ciężko pracować. Wygląda na to, że będę przeciągany, kopiąc i krzycząc z powrotem do programowania w języku Java. Pomiędzy nim a Stanfordem i LingPipe widzę wiele świetnych opcji w świecie open source.

1

Jeśli podoba Ci się UIMA, bardzo przyda Ci się ClearTK. Jest on implementowany przez UIMA i ma opakowania dla wielu bibliotek NLP/ML (OpenNLP, Stanford NLP, Mallet, LibSVM itd.). Ma również dobre przykłady klasyfikacji dokumentów, znakowania POS, rozpoznawania nazw obiektów itp.

Powiązane problemy