2013-04-05 9 views
19

Znam ogólny temat pytania, ale nadal chcę wiedzieć, jaka jest najszybsza biblioteka rozpoznawania mowy w C++?Najszybsza biblioteka rozpoznawania mowy C++

Obecnie używam Microsoft SAPI z kniect. Działa dobrze i rozpoznaje słowa, ale jego działanie jest powolne, czasami potrzeba 1, 2 sekundy, aby rozpoznać słowo, aw moim przypadku to opóźnienie powoduje wiele problemów z interakcją dla użytkownika.

Sprawdziłem próbkę dostarczoną z kinect, w którym żółw przesuwa się w lewo w prawo, zgodnie z rozpoznanymi słowami, ale nawet to trochę wolniej.

Więc zastanawiałem się, czy jest jakaś szybsza biblioteka niż sapi, która może być użyta w przypadkach takich jak robot używający rozpoznawania głosu, mówisz "lewo", a potem "prawo", ale robot przesuwa się w lewo i skręca w prawo po 1,2 sekundy to trochę frustrujące dla użytkownika.

+1

Powinieneś wykonać dogłębne badania. –

Odpowiedz

9

Problem nie jest szybki, ale właściwy sposób korzystania z interfejsu API. Rozpoznawanie mowy jest procesem czasochłonnym, więc główną zasadą jest rozpoczęcie rozpoznawania dźwięku , gdy tylko zostanie nagrana, równolegle z nagraniem. Do momentu wypowiedzenia frazy "koniec" uzyskasz prawie wszystkie wyniki i możesz natychmiast zareagować.

Czas reakcji wynoszący 0,2 sekundy może zostać osiągnięty w ten sposób, ale do wdrożenia tego potrzebny jest bardziej elastyczny interfejs API. Dobry wybór to CMUSphinx, framework do rozpoznawania mowy oparty na otwartym kodzie źródłowym, który możesz wykorzystać do swojej implementacji.

+0

"Zgadzam się z tobą, a morał z tego jest": - musisz wiedzieć, jak to zaprogramować. – SChepurin

Powiązane problemy