Próbowałem użyć drzewka zależności zależności generowanych przez CMU's TurboParser. Działa bezbłędnie. Problem polega jednak na tym, że istnieje bardzo mało dokumentacji. Muszę dokładnie zrozumieć wynik ich parsera. Na przykład zdanie „I rozwiązać problem ze statystyką.” Generuje następujący wynik:Co oznacza dane wyjściowe analizatora zależności TurboParser?
1 I _ PRP PRP _ 2 SUB
2 solved _ VBD VBD _ 0 ROOT
3 the _ DT DT _ 4 NMOD
4 problem _ NN NN _ 2 OBJ
5 with _ IN IN _ 2 VMOD
6 statistics _ NNS NNS _ 5 PMOD
7 . _ . . _ 2 P
nie znalazłem żadnej dokumentacji, która może pomóc zrozumieć, co poszczególne kolumny oznaczają i jak indeksy w drugiej ostatniej kolumnie (2, 0, 4, 2, ...) są tworzone. Ponadto nie mam pojęcia, dlaczego są dwie kolumny poświęcone znacznikom części mowy. Każda pomoc (lub link do zewnętrznej dokumentacji) będzie bardzo pomocna.
P.S. Jeśli chcesz wypróbować ich parser, here is their online demo.
P.P.S. Proszę nie sugerować używania wyników analizy zależności Stanforda. Interesują mnie algorytmy programowania liniowego, co nie jest tym, co robi system NLP Stanforda.