Rozdział 5 Pythonie NLTK book daje ten przykład tagowania słów w zdaniu:Python NLTK: Jak oznaczać zdania za pomocą uproszczonego zestawu znaczników części mowy?
>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
nltk.pos_tag wywołuje domyślny Taggera który wykorzystuje pełen zestaw znaczników. W dalszej części rozdziału wprowadzono kod simplified set of tags.
Jak mogę oznaczyć zdania za pomocą tego uproszczonego zestawu znaczników części mowy?
Również zrozumiałem tagger poprawnie, tj. Czy mogę zmienić zestaw znaczników, którego tagger używa, jak pytam, czy powinienem odwzorować znaczniki, które zwraca do uproszczonego zestawu, czy też powinienem utworzyć nowego znacznika z nowego, po prostu otagowanego korpusu?
Świetne, dzięki. –