2011-12-27 13 views
7

Mimo że mam doświadczenie w EE, nie miałem okazji uczestniczyć w lekcjach przetwarzania języka naturalnego.Jak mogę zacząć budować wordnet dla języka tureckiego do wykorzystania w analizie nastrojów

Chciałbym zbudować narzędzie do analizy nastrojów dla języka tureckiego. Myślę, że najlepiej jest stworzyć turecką bazę danych wordnet zamiast przetłumaczyć tekst na angielski i przeanalizować go za pomocą przetłumaczonego tekstu z użyciem dostarczonych narzędzi. (czy to?)

Więc co polecacie mi zrobić? Przede wszystkim biorąc zajęcia NLP ze strony otwartej klasy? Naprawdę nie wiem od czego zacząć. Czy możesz mi pomóc i może dostarczyć mi krok po kroku? Wiem, że to projekt akademicki, ale jestem zainteresowany budowaniem umiejętności jako hobby w tej dziedzinie.

Z góry dziękuję.

+0

Być może zainteresuje Cię propozycja dla potentii l nowe witryny SE, w tym [język turecki i sposób użycia] (http://area51.stackexchange.com/proposals/30873/turkish-language-usage?referrer=wKPqNxBBY-xKcrw-ScJbLA2) i [StackOverflow w języku tureckim] (http://area51.stackexchange.com/proposals/34945/stack-overflow-in-turkish?referrer=6DTBHmak2NY7uyvjVsZajA2). – Caleb

+0

Myślę, że masz rację, jeśli chodzi o potrzebę zbudowania tureckiej bazy danych słów i fraz, zamiast tłumaczyć. Jednak nie jestem pewien, czy to najlepsze miejsce na to pytanie. Może to być właściwe pytanie, które należy przenieść na stronę [Programmer.SE] (http://programmers.stackexchange.com/) jako problem koncepcyjny, a nie na kodowanie. Myśli? – Caleb

+1

Możesz mieć rację. Szukasz sposobu na migrację do tej sekcji. –

Odpowiedz

3

Oto proces użyłem wcześniej (co japońskim, chińskim, niemieckim i arabskim sieci semantyczne):

  1. Zbierz co najmniej dwóch tureckich słowniki angielskie /. Muszą być niezależne, nie pochodzące od siebie. Możesz użyć Wikipedii, aby automatycznie generować jeden ze swoich słowników. Jeśli chcesz opublikować swoją sieć, możesz potrzebować słowników o otwartym kodzie źródłowym, opłat licencyjnych lub prawnika.
  2. Skorzystaj z tych słowników, aby przetłumaczyć angielski Wordnet, tworząc ocenę pewności dla każdego zestawu.
  3. Zachowaj osoby z dużą pewnością siebie, ręcznie zatwierdzając lub naprawiając osoby o średnim lub niskim zaufaniu.
  4. Wykończenie go ręcznie

I rozszerzony na ten temat w sekcji „Automatyczne tłumaczenie WordNet” mojego papieru 2008: http://dcook.org/mlsn/about/papers/nlp2008.MLSN_A_Multilingual_Semantic_Network.pdf

(Dla założonego celu tureckiego słowniku nastrojów, istnieją inne podejścia, nie angażujące sieci semantycznej, np. "Analiza semantyczna i wydawanie opinii" autorstwa Bing Liu, to dobre podsumowanie badań, ale podejście oparte na sieci semantycznej, IMHO, zawsze da lepsze wyniki w dłuższej perspektywie i tak wiele innych zastosowań.)

Powiązane problemy