Czy w dowolnym miejscu mogę pobrać Treebank z angielskich wyrażeń za darmo lub mniej niż 100 USD? Potrzebuję danych treningowych zawierających pęczek zdań syntaktycznych (> 1000) w języku angielskim w dowolnym formacie. Zasadniczo potrzebuję tylko słów w tym zdaniu rozpoznawanych przez część mowy.Czy istnieje Treebank za darmo?
Odpowiedz
NLTK (dla Python) oferuje kilka treebanks for free.
Dzięki, +1. Nie znam Pythona, więc radzę, proszę, jak mogę przeanalizować pliki * .pickle? Czy każdy konwerter jest bardziej przyjazny dla użytkownika, taki jak XML lub zwykły tekst? – YMC
Jaki plik pikla? The Treebanks są w formacie tekstowym. Np. Http://nltk.googlecode.com/svn/trunk/nltk_data/packages/corpora/treebank.zip. – cyborg
19 języków za darmo tutaj: http://universaldependencies.github.io/docs/ – CpILL
Co powiesz na Penn Treebank? Mam nadzieję, że będzie to bezpłatne lub przynajmniej możliwe. http://www.cis.upenn.edu/~treebank/cdrom2.html
Kosztuje 3150 USD w LDC: http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC99T42 – YMC
Jest wliczony wraz z wieloma innymi drzewami w OntoNotes 4.0 http://www.ldc.upenn.edu/Catalog/catalogEntry.jsp?catalogId=LDC2011T03, który jest darmowy (choć trzeba zapłacić koszt dystrybucji). –
jak koszt dystrybucji? – CpILL
Oto kilka (angielski) treebanks dostępne za darmo:
American National Corpus: MASC
Pytania: QuestionBank i Stanford's corrections
brytyjski news: BNC
TED Talks: NAIST-NTT TED Treebank
Georgetown University Wielowarstwowe Corpus: GUM
Biomedical:
Zobacz także Wikipedia dla ogromnej listy.
- 1. Czy można podpisać aplet java za darmo?
- 2. leniwe inicjowanie za darmo
- 3. Czy Java EE 6 wszystko za darmo?
- 4. Websphere 7 pobierz za darmo
- 5. Podwójnie za darmo lub korupcja
- 6. Dźwięk aplikacji Android za darmo
- 7. Import definicji swagger do SoapUI za darmo?
- 8. Czy istnieje sposób na podanie kodów promocyjnych/kuponów dla osób, które mogą pobrać aplikację za darmo?
- 9. Czy mogę naprawdę rozwijać na ASP.NET MVC za darmo?
- 10. Jak zaszyfrować plik PHP za darmo?
- 11. Jak korzystać z Bintray jcenter za darmo?
- 12. darmo podwójny wskaźnik
- 13. Rachunki w aplikacji Google Play podające produkt za darmo
- 14. Gdzie mogę znaleźć ładną .NET Tab Control za darmo?
- 15. Gdzie jest możliwe pobranie plików ".dcm" za darmo?
- 16. Dlaczego otrzymuję OutOfMemory, gdy 20% sterty jest nadal za darmo?
- 17. Generowanie kodu kreskowego za darmo 3 z 9 czcionek
- 18. Hack za darmo w Androidzie w aplikacji - jak to działa?
- 19. Android: jak narysować za darmo na wszystko (dowolna aktywność)
- 20. C++ Usuń tablicę wskaźników - podwójnie za darmo lub z korupcją
- 21. Konsola programisty Google Play: płatne aplikacje testowe beta za darmo?
- 22. LD_PRELOAD działa tylko dla malloc, nie za darmo
- 23. Zmieniaj płatną aplikację za darmo, ale wiedz, czy użytkownik ją wcześniej kupił.
- 24. Czy mogę zamieścić Arial Narrow na stronie internetowej za darmo przy użyciu @ font-face?
- 25. Czy istnieje "Edytor struktury drzewa" dla Lispa?
- 26. Czy istnieje zastosowanie dla TheaderControl w Delphi
- 27. Czy istnieje dobre narzędzie do reflaktowania kodu internetowego Perla?
- 28. Co się stanie, jeśli ponownie przydzielę, a nowy rozmiar to 0. Czy to jest odpowiednik za darmo?
- 29. Zezwalaj użytkownikom na pobranie własną płatną aplikację za darmo w Android
- 30. Sprawdź, czy tylko jeden element istnieje za pomocą Guava
Czy w NLTK nie ma dużego podzbioru banku drzew Penn? –
@ on-hold: w rzeczywistości jest to bardzo przydatne pytanie, a odpowiedzi są również bardzo przydatne, ponieważ są to stosunkowo rzadkie zasoby. Pamiętaj, to nie jest pytanie "jest lepsze od B", ale "lista wszystkich zasobów typu X pod warunkiem Y". – rec
To niedorzeczne, że LDC pobiera opłaty za zestawy danych ... W każdym razie zobacz https://en.wikipedia.org/wiki/Treebank#Syntactic_treebanks –