2011-12-31 12 views
10

Próbuję dowiedzieć się, jak używać sphinx4 lub pocketsphinx z angielskim modelem voxforge, ale nie mogę go uruchomić. Próbowałem czytać strony dokumentu (takie jak ten http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html), ale to mi nie pomaga.Jak używać CMU Sphinx 4 do mowienia na tekst z angielskimi modelami voxforge

To, czego chcę, to plik wykonywalny, w którym mogę określić, którego modelu używać i który plik audio ma być używany jako źródło i mieć wydruk wykonywalny, najlepiej zgadnąć, co mówi głos w nagraniu.

ja hade trochę szczęścia: pocketsphinx_continuous -infile recording.wav 2>/dev/null

Ale to przerywa zanim pełna pliku audio transkrypcji i domyślny model ma waay do kilku słów, aby stworzyć czytelny tekst z audio.

Mam skompilowane i przetestowane wersje demonstracyjne w pakiecie źródłowym sphinx4, ale wszystkie przykłady wydają się mieć kilka słów i potrzebują modelu, aby mógł mi się przydać.

Jak mogę to ustawić?

+1

byłem w stanie zmodyfikować Sfinksa do transkrypcji za pomocą modeli Voxforge. Zła wiadomość jest taka, że ​​nawet w przypadku Voxforge dokładność Sphinx jest krępująco zła. Nie zmarnowałbym twojego czasu z Sfinksem. W ogóle nie można go usunąć. – Cerin

+0

@Cerin, co poleciłbyś jako alternatywę? –

+0

Jestem również zainteresowany alternatywami. Czy możesz dać nam coś lepszego? Wolisz za darmo? – Simon

Odpowiedz

10

Bardzo łatwo jest podłączyć akustyczny model Voxforge. Dokument główny obejmujące API jest cmusphinx poradnik:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Zaleca się, aby ją przeczytać przed rozpoczęciem pracy. Należy również pamiętać, że zaleca się stosowanie modelu akustycznego EN_US English Generic, który jest bardziej dokładny niż Voxforge.

Krok po kroku trzeba wykonać następujące czynności:

  • Pobierz voxforge model z SourceForge i rozpakować go do folderu
  • Kasa Sphinx4 z github i zbudować go z Gradle
  • Run TranscriberDemo
  • Przejdź do folderu sphinx4-samples/src/main/java/edu/cmu/sphinx/demo/transcriber, otwórz Transcriber demo i zmodyfikuj ścieżkę modelu akustycznego jak poniżej.
  • Zmień lokalizację pliku audio w źródłach jeśli potrzebujesz inny plik dźwiękowy ponownie
  • Run demo i cieszyć

Byłoby to

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

Bardzo ładna odpowiedź ... mam też podobny problem Pobrałem voxforge-en-0.3 z SourceForge, folder etc ma tak wiele słoików, po prostu nie mogę określić, która ścieżka powinna być podana ... proszę o pomoc i odwiedź http: // stackoverflow.com/questions/8727389/dictation-application-using-sphinx4 – aProgrammer

+0

Nie jestem pewien, o czym mówisz. Jakie słoiki w etc? W ogóle nie ma słoików. Jeśli chodzi o to pytanie, nie wskazałeś jasno problemu do rozwiązania, nie masz pojęcia, jaki masz problem. –

+0

Podążyłem za twoją odpowiedzią i pobrałem VoxForge ze źródła sourceforge, jednak nie mogłem go skonfigurować do użycia z Sphinx4. Powiedziałeś "', ale to nie działa dla mnie. Przeglądałem folder VoxForge, ale wypróbowałem różne kombinacje ... ale nic nie działa tak daleko ... plz Pomóż !! zobacz edytowaną odpowiedź .... – aProgrammer

Powiązane problemy