mam (duży) wykaz analizowanych zdań (które były analizowana z wykorzystaniem parser Stanford), na przykład zdanie: „Teraz można się bawić” ma następujące drzewa:Jak używać NLTK do generowania zdań z indukowanej gramatyki?
(ROOT
(S
(ADVP (RB Now))
(, ,)
(NP (PRP you))
(VP (MD can)
(VP (VB be)
(VP (VBN entertained))))
(. .)))
Używam zestaw drzew zdanie do wywołania gramatykę używając NLTK:
import nltk
# ... for each sentence tree t, add its production to allProductions
allProductions += t.productions()
# Induce the grammar
S = nltk.Nonterminal('S')
grammar = nltk.induce_pcfg(S, allProductions)
teraz chciałbym użyć grammar
do generowania nowych, przypadkowych zdań. Mam nadzieję, że skoro gramatyka została wyuczona z określonego zbioru przykładów wejściowych, to wygenerowane zdania będą semantycznie podobne. Czy mogę to zrobić w Nltk?
Jeśli nie mogę użyć nltk, aby to zrobić, czy istnieją jakieś inne narzędzia, które mogą zająć (prawdopodobnie przeformatowane) grammar
i generować zdania?
W tym samym miejscu, proszę sprawdzić ten wątek http: //stackoverflow.com/questions/39061349/paraphrasing-using-nltk –