Konwersja audio do tekstu

Po prostu chcę wiedzieć, czy istnieją jakieś wbudowane biblioteki lub biblioteki zewnętrzne w Javie lub C#, które pozwalają mi pobrać plik audio i przeanalizować go i wyodrębnić z niego tekst.Konwersja audio do tekstu

Muszę złożyć wniosek, aby to zrobić, ale nie wiem skąd mogę zacząć.

Źródło

2010-10-18 Amira Elsayed Ismail

zdecydowanie nie jest wbudowany. Rozumiem, że chcesz przedłużyć swoje pytania do bibliotek, których możesz używać z Javy lub C#. – Thilo

Dzięki, panie Thilo, ok, jeśli znasz jakieś zewnętrzne biblioteki C# lub Java, które mogą robić to, co chcę, będę wdzięczny, jeśli mi powiesz, Dzięki z góry –

To może pomóc http://java.sun.com/ products/java-media/speech/reference/codesamples/index.html –

Oto niektóre z dostępnych opcji:

Źródło

2010-10-18 11:27:50

Możesz sprawdzić Microsoft Speech API. Myślę, że zapewniają pakiet SDK, który możesz wykorzystać do swojego celu.

Źródło

2010-10-18 11:14:09 jassuncao

Java, wydaje się, że jest to rozwiązanie od firmy Sun: javax.speech.recognition

Źródło

2010-10-18 13:35:50

Możesz użyć SoX (szwajcarski scyzoryk programów do przetwarzania dźwięku), aby przekonwertować plik audio do pliku tekstowego z wartościami numerycznymi odpowiadającymi częstotliwości/głośności dźwięku.

Zrobiłem to dla poprzedniego projektu, ale nie znam dokładnych opcji polecenia.

jest łącze z projektem: http://sox.sourceforge.net/Main/HomePage

Źródło

2012-01-10 23:46:07 Ivelin

Oto cały przykład za pomocą C# i System.Speech

Kod może być podzielona na 2 części:

konfigurujących przedmiotu SpeechRecognitionEngine (i jego wymagane elementy) obsługa zdarzeń SpeechRecognized i SpeechHossesized.

Krok 1: Konfiguracja SpeechRecognitionEngine

_speechRecognitionEngine = new SpeechRecognitionEngine(); 
_speechRecognitionEngine.SetInputToDefaultAudioDevice(); 
_dictationGrammar = new DictationGrammar(); 
_speechRecognitionEngine.LoadGrammar(_dictationGrammar); 
_speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

W tym momencie Twój obiekt jest gotowy do zapisywania dźwięku z mikrofonu. Musisz jednak zająć się niektórymi zdarzeniami, aby faktycznie uzyskać dostęp do wyników.

Etap 2: obsługę zdarzeń SpeechRecognitionEngine

_speechRecognitionEngine.SpeechRecognized - = nowy Podprogram (SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized - = new EventHandler (SpeechHypothesizing);

_speechRecognitionEngine.SpeechRecognized + = new EventHandler (SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized + = new EventHandler (SpeechHypothesizing);

private void SpeechHypothesizing (object sender, SpeechHypothesizedEventArgs e) {/// wyniki w czasie rzeczywistym z silnika ciąg realTimeResults = e.Result.Tekst; }

private void SpeechRecognized (object sender, SpeechRecognizedEventArgs e) { /// ostateczna odpowiedź z ciągiem silnika finalAnswer = e.Result.Text; }

To wszystko. Jeśli chcesz użyć wstępnie nagrany plik .wav zamiast mikrofonu, należy użyć

_speechRecognitionEngine.SetInputToWaveFile (pathToTargetWavFile);

zamiast

_speechRecognitionEngine.SetInputToDefaultAudioDevice();

Istnieje kilka różnych opcji w tych klasach i warto je poznać bardziej szczegółowo.

http://ellismis.com/2012/03/17/converting-or-transcribing-audio-to-text-using-c-and-net-system-speech/

Źródło

2012-03-17 17:09:48 bulltorious

Konwersja audio do tekstu

Odpowiedz

Powiązane problemy