Próbuję wyodrębnić nazwane elementy z mojego tekstu za pomocą NLTK. Uważam, że NLTK NER nie jest zbyt dokładny dla mojego celu i chcę dodać kilka własnych tagów. Próbowałem znaleźć sposób na wyszkolenie mojego NER, ale wydaje mi się, że nie jestem w stanie znaleźć odpowiednich zasobów. Mam kilka pytań dotyczących NLTK-NLTK Rozpoznawanie nazwanego obiektu przy użyciu niestandardowych danych
- mogę korzystać z własnych danych do pociągu jest wyznaczony podmiot Rozpoznawanie w NLTK?
- Jeśli mogę ćwiczyć używając własnych danych, czy plik named_entity.py ma zostać zmodyfikowany?
- Czy format pliku wejściowego musi być w IOB np. Eric NNP B-PERSON?
- Czy są jakieś zasoby - oprócz książki kucharskiej nltk i nlp z pythonem, których mogę użyć?
Naprawdę uprzejmie pomocy w tym zakresie
Przeglądając stronę SNER, zobaczyłem, że istnieje nawet interfejs Pythona [tutaj] (https://github.com/dat/pyner). Nie wiem, jak dojrzałe, ale może być pomocne. – senderle
To pytanie pojawia się dużo w poszukiwaniu poprawienia rozpoznawania nazwanych obiektów nltk, ale powiedzenie "lol use something else" nie jest tak pouczające. – blueblank
Miałem ten sam problem i podzieliłem się tym, co sprawdziło się u mnie. Przepraszam, jeśli Cię to zdenerwowało :( – jjdubs