Więc analizowałem korpus tekstowy i użyłem stemplowania dla wszystkich tokenizowanych słów. Ale muszę również znaleźć wszystkie rzeczowniki w korpusie, więc znowu zrobiłem nltk.pos_tag(stemmed_sentenc
Czy istnieje mikroformat dla podstawowego procesu języka naturalnego, który zawiera znaczniki zdań, słów, części mowy itp.? Przeszukałem internet, ale nie mogłem go znaleźć.
Interesuje mnie dowiedzieć się więcej o Natural Language Processing (NLP) i jestem ciekawy, czy istnieją obecnie jakieś strategie rozpoznawania rzeczowników w tekście, które nie są oparte na rozpoznaw