Używam domyślnego tagowania POS i domyślnej tokenizacji ... i wydaje się wystarczająca. Chciałbym też ich domyślny fragment.Jaki jest domyślny fragment pakietu narzędzi NLTK w Pythonie?
Czytam książkę narzędziową NLTK, ale nie wygląda na to, że mają domyślną porcję?
Co, jeśli nie jestem bardzo zaniepokojony named_entities, ale ogólnie w ogóle. Na przykład "żółty pies" to porcja, a "działa" to porcja. – TIMEX
Tak, nie ma domyślnie mojej wiedzy (choć nie wiem wszystkiego o nltk, na pewno). Możesz użyć RegexpChunkParser, ale będziesz musiał sam opracować zasady. Oto przykład: http://gnosis.cx/publish/programming/charming_python_b18.txt – ealdent