Robiłem trochę porównanie tych dwóch pakietów i nie jestem pewien, w jakim kierunku pójść w co szukam to krótko:OpenNLP vs Stanford CoreNLP
- rozpoznawanie jednostek nazwanych (ludzie, miejsca, , organizacje i podobne).
- Identyfikacja płci.
- Przyzwoity interfejs szkoleniowy.
Z tego co wiem, OpenNLP i Stanford CoreNLP mają podobne możliwości. Jednak Stanford CoreNLP wygląda na to, że ma o wiele więcej aktywności, podczas gdy OpenNLP miał tylko kilka zatwierdzeń w ciągu ostatnich sześciu miesięcy.
Na podstawie tego, co zobaczyłem, OpenNLP wydaje się łatwiejsze do szkolenia nowych modeli i może być bardziej atrakcyjny tylko z tego powodu. Jednak moje pytanie brzmi: od czego inni zaczynają jako podstawa dodawania funkcji NLP do aplikacji Java? Martwię się głównie o to, czy OpenNLP jest "po prostu dojrzałe", czy raczej porzucone.
CoreNLP jest open source. Jest wydany pod GPL v3 na GitHub. –