2013-01-10 11 views
16

Niedawno zacząłem studiować rozpoznawanie mowy OpenEars i to świetnie! Ale muszę też wspierać rozpoznawanie mowy i dyktowanie w innych językach, na przykład rosyjskim, francuskim i niemieckim. Stwierdziłem, że dostępne są różne modele akustyczne i językowe: here.Dodaj nowy język do OpenEars

Ale nie mogę tego zrozumieć - czy to wystarczy, aby zintegrować dodatkowe wsparcie językowe w aplikacji?

Pytanie - jakie kroki należy podjąć, aby z powodzeniem zintegrować, na przykład rosyjski, w Open Ears?

O ile zrozumiałem - wszystkie modele akustyczne i językowe dla języka angielskiego w otwartych Ears demo znajduje się w folderze hub4wsj_sc_8k. Te same pliki można znaleźć w voxforge language archives. Więc po prostu zastąpiłem je w wersji demo. Jedno jest inna - w demo języku angielskim, nie było też sendump 2MB duży plik, który nie znajduje się w językowej voxforge archives.There są dwa inne pliki używane w Open Ears Demo:

  • OpenEars1.languagemodel
  • OpenEars1.dic

To ja brzmienie:

  • msu_ru_nsh.lm.dmp
  • msu_ru_nsh.dic

jako .dmp jest podobna do .languagemodel. Ale aplikacja ulega awarii bez żadnego błędu.

Co robię źle? Dziękuję Ci.

+6

Witam Guntis, programista OpenEars. Cieszę się, że znalazłeś świetne ramy! Krok 1 w przypadku takich problemów to włączenie OpenEarsLogging i verbosePocketsphinx, które dadzą ci bardzo dokładną informację o tym, co dzieje się nie tak (szukaj wyników w konsoli z powodu błędu słów i ostrzeżenia, aby zaoszczędzić czas). Instrukcje dotyczące tego można znaleźć w dokumentach. Możesz zadawać pytania na forach OpenEars, ponieważ dogłębne rozwiązywanie problemów nie jest dobrym rozwiązaniem dla SO: http://politepix.com/forums/openears Możesz również sprawdzić ten wątek: http: // politepix. com/forums/topic/other-languages ​​/ – Halle

+2

Aby śledzić późniejszych czytelników, po włączeniu logowania uzyskaliśmy to działając, używając pliku mieszaniny_weight jako substytutu sendump i upewniając się, że słownik fonetyczny użył fonemów, które były obecne w modelu akustycznym, a nie fonemy w języku angielskim. – Halle

+0

@Halle Czy możesz to opublikować jako odpowiedź, więc pytanie nie pozostanie otwarte? –

Odpowiedz

10

Z moich uwagach zamieszczać jako odpowiedź:

[....] Krok 1 na takich kwestiach, jak to jest, aby włączyć OpenEarsLogging i verbosePocketsphinx, który daje bardzo precyzyjną informacje o tym, co się dzieje źle (wyszukuje dane wyjściowe z konsoli, aby uzyskać komunikat o błędzie i ostrzeżenie, aby zaoszczędzić czas). Instrukcje dotyczące tego można znaleźć w dokumentach. Zapraszam do przynieść pytania na forach OpenEars [....]: http://politepix.com/forums/openears Warto również sprawdzić ten wątek: http://politepix.com/forums/topic/other-languages

Rozwiązanie:

Aby śledzić na późniejszych czytelników, po włączeniu rejestrowania działa to poprzez użycie pliku mieszaniny_weights jako substytutu sendump i upewnienie się, że słownik fonetyczny użył fonemów, które były obecne w modelu akustycznym, a nie fonemy w języku angielskim.

Pełne omówienie, w którym osiągnęliśmy ten temat rozwiązywania problemów można przeczytać tutaj: http://www.politepix.com/forums/topic/using-russian-acoustic-model/


UPDATE: Ponieważ OpenEars 1.5 został wydany w tym tygodniu, możliwe jest, aby przejść ścieżkę do dowolnego modelu akustycznego jako argument do głównej metody nasłuchiwania i istnieje znacznie bardziej wystandaryzowana metoda pakowania i odwoływania się do dowolnego modelu akustycznego, dzięki czemu możesz mieć wiele modeli akustycznych w tej samej aplikacji.Informacje znajdujące się na tym forum zastępują informacje zawarte w dyskusji, do której dołączyłem w tej odpowiedzi: http://www.politepix.com/forums/topic/creating-an-acoustic-model-bundle-for-openears-1-5-and-up/ Resztę odpowiedzi zostawiłem z powodów historycznych i dlatego, że w tej dyskusji mogą być szczegóły, które są nadal przydatne, ale można je pominąć korzyść z nowego łącza.

+0

Dziękujemy! Jestem pewien, że to pomoże wielu, tak jak Ty mi pomogłeś :) –

+0

Nie ma za co, a dzięki za wkład jakościowy podczas procesu rozwiązywania problemów, który ułatwił Ci pomoc. – Halle

Powiązane problemy