2012-01-27 7 views
5

Czy ktoś może mi powiedzieć, jak używać wcześniej wyszkolonego modelu MaltParser (http://maltparser.org/mco/english_parser/engmalt.html) w nltk.parse.malt? Wydaje się, że jedyną opcją jest trenowanie z pliku (jeśli ktokolwiek mógłby wskazać mi drogę do dobrego, publicznie dostępnego pliku szkoleniowego, byłoby to również świetne).Korzystanie ze wstępnie wyszkolonego modelu MaltParser z NLTK

Odpowiedz

1


Odnośnie korzystania pretrained model - Wydaje się to było (i wydaje się wciąż być) otwarty temat na forum NLTK dev: https://github.com/nltk/nltk/issues/145

Z tego co rozumiem można zrobić to poprzez ustawienie jakąś wewnętrzną zmienną:

„I choć można ręcznie ustawić pole MCO na obiekcie, który nie jest narażony na API , a użytkownik, który nie wykopał kodu, nie wiedziałby o tym. "

Jednak nie mogłem znaleźć konkretnego miejsca, aby to zrobić.

chodzi o uzyskanie pretrained modelu - mam na myśli do tego tematu na SO:

Does NLTK have a tool for dependency parsing?

3

Interfejs MaltParser w starszych wersjach NLTK wykorzystywane hardcode ścieżkę do modelu. Zostało to naprawione w zatwierdzeniu e9e443. Można teraz wykonać następujące czynności:

maltparser = MaltParser(mco="/path/to/your/model.mco") 

W chwili pisania tego, easy_install i pip jeszcze zainstalować wersję NLTK, który nie zawiera tę poprawkę (2.0.1rc4). Jeśli nie możesz sobie pozwolić na przejście na krawędzi krwawienia wersji, można użyć następującego Hack:

maltparser = MaltParser() 
maltparser.mco = "/path/to/your/model.mco" 

Pre-przeszkolony modeli można znaleźć na MaltParser's official website.

Powiązane problemy