Próbuję dowiedzieć się, jak używać sphinx4 lub pocketsphinx z angielskim modelem voxforge, ale nie mogę go uruchomić. Próbowałem czytać strony dokumentu (takie jak ten http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html), ale to mi nie pomaga.Jak używać CMU Sphinx 4 do mowienia na tekst z angielskimi modelami voxforge
To, czego chcę, to plik wykonywalny, w którym mogę określić, którego modelu używać i który plik audio ma być używany jako źródło i mieć wydruk wykonywalny, najlepiej zgadnąć, co mówi głos w nagraniu.
ja hade trochę szczęścia: pocketsphinx_continuous -infile recording.wav 2>/dev/null
Ale to przerywa zanim pełna pliku audio transkrypcji i domyślny model ma waay do kilku słów, aby stworzyć czytelny tekst z audio.
Mam skompilowane i przetestowane wersje demonstracyjne w pakiecie źródłowym sphinx4, ale wszystkie przykłady wydają się mieć kilka słów i potrzebują modelu, aby mógł mi się przydać.
Jak mogę to ustawić?
byłem w stanie zmodyfikować Sfinksa do transkrypcji za pomocą modeli Voxforge. Zła wiadomość jest taka, że nawet w przypadku Voxforge dokładność Sphinx jest krępująco zła. Nie zmarnowałbym twojego czasu z Sfinksem. W ogóle nie można go usunąć. – Cerin
@Cerin, co poleciłbyś jako alternatywę? –
Jestem również zainteresowany alternatywami. Czy możesz dać nam coś lepszego? Wolisz za darmo? – Simon