Mam następujący kod w Pythonie.Jak wygenerować wiele drzew parsowanych dla niejednoznacznego zdania w NLTK?
sent = [("very","ADJ"),("colourful","ADJ"),("ice","NN"),("cream","NN"),("van","NN")]
patterns= r"""
NP:{<ADJ>*<NN>+}
"""
NPChunker=nltk.RegexpParser(patterns) # create chunk parser
for s in NPChunker.nbest_parse(sent):
print s.draw()
Wyjście jest:
(S (NP very/ADJ colourful/ADJ ice/NN cream/NN van/NN))
Ale wyjście powinno mieć kolejne 2 drzewo wyprowadzenia.
(S (NP very/ADJ colourful/ADJ ice/NN) (NP cream/NN) (NP van/NN))
(S (NP very/ADJ colourful/ADJ ice/NN cream/NN) van/NN)
Problem polega na tym, że RegexpParser pobiera tylko pierwsze wyrażenie regularne. Jak mogę wygenerować wszystkie możliwe drzewa analizy jednocześnie?