Jak używać CMU Sphinx 4 do mowienia na tekst z angielskimi modelami voxforge

Próbuję dowiedzieć się, jak używać sphinx4 lub pocketsphinx z angielskim modelem voxforge, ale nie mogę go uruchomić. Próbowałem czytać strony dokumentu (takie jak ten http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html), ale to mi nie pomaga.Jak używać CMU Sphinx 4 do mowienia na tekst z angielskimi modelami voxforge

To, czego chcę, to plik wykonywalny, w którym mogę określić, którego modelu używać i który plik audio ma być używany jako źródło i mieć wydruk wykonywalny, najlepiej zgadnąć, co mówi głos w nagraniu.

ja hade trochę szczęścia: pocketsphinx_continuous -infile recording.wav 2>/dev/null

Ale to przerywa zanim pełna pliku audio transkrypcji i domyślny model ma waay do kilku słów, aby stworzyć czytelny tekst z audio.

Mam skompilowane i przetestowane wersje demonstracyjne w pakiecie źródłowym sphinx4, ale wszystkie przykłady wydają się mieć kilka słów i potrzebują modelu, aby mógł mi się przydać.

Jak mogę to ustawić?

Źródło

2011-12-31 Tirithen

byłem w stanie zmodyfikować Sfinksa do transkrypcji za pomocą modeli Voxforge. Zła wiadomość jest taka, że nawet w przypadku Voxforge dokładność Sphinx jest krępująco zła. Nie zmarnowałbym twojego czasu z Sfinksem. W ogóle nie można go usunąć. – Cerin

@Cerin, co poleciłbyś jako alternatywę? –

Jestem również zainteresowany alternatywami. Czy możesz dać nam coś lepszego? Wolisz za darmo? – Simon

Bardzo łatwo jest podłączyć akustyczny model Voxforge. Dokument główny obejmujące API jest cmusphinx poradnik:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Zaleca się, aby ją przeczytać przed rozpoczęciem pracy. Należy również pamiętać, że zaleca się stosowanie modelu akustycznego EN_US English Generic, który jest bardziej dokładny niż Voxforge.

Krok po kroku trzeba wykonać następujące czynności:

Pobierz voxforge model z SourceForge i rozpakować go do folderu
Kasa Sphinx4 z github i zbudować go z Gradle
Run TranscriberDemo
Przejdź do folderu sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber, otwórz Transcriber demo i zmodyfikuj ścieżkę modelu akustycznego jak poniżej.
Zmień lokalizację pliku audio w źródłach jeśli potrzebujesz inny plik dźwiękowy ponownie
Run demo i cieszyć

Byłoby to

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000");

Źródło

2012-01-02 09:41:33

Bardzo ładna odpowiedź ... mam też podobny problem Pobrałem voxforge-en-0.3 z SourceForge, folder etc ma tak wiele słoików, po prostu nie mogę określić, która ścieżka powinna być podana ... proszę o pomoc i odwiedź http: // stackoverflow.com/questions/8727389/dictation-application-using-sphinx4 – aProgrammer

Nie jestem pewien, o czym mówisz. Jakie słoiki w etc? W ogóle nie ma słoików. Jeśli chodzi o to pytanie, nie wskazałeś jasno problemu do rozwiązania, nie masz pojęcia, jaki masz problem. –

Podążyłem za twoją odpowiedzią i pobrałem VoxForge ze źródła sourceforge, jednak nie mogłem go skonfigurować do użycia z Sphinx4. Powiedziałeś "', ale to nie działa dla mnie. Przeglądałem folder VoxForge, ale wypróbowałem różne kombinacje ... ale nic nie działa tak daleko ... plz Pomóż !! zobacz edytowaną odpowiedź .... – aProgrammer

Jak używać CMU Sphinx 4 do mowienia na tekst z angielskimi modelami voxforge

Odpowiedz

Powiązane problemy