2011-09-22 12 views

Odpowiedz

9

Istnieje kilka komercyjnych bibliotek IOS do rozpoznawania mowy. Imiona, które słyszę, to Nuance, iSpeech i Yapme. Każdy oferuje rozpoznawanie mowy w chmurze (poza urządzeniem) oraz bibliotekę klienta i pakiet SDK do wbudowania w aplikację.

Nuance wydaje się wspierać hiszpański - http://blog.dragonmobileapps.com/2011/01/mobile-app-developer-dragon-mobile-sdk.html

... można mowy włączyć aplikację dla USA i Wielkiej Brytanii w tym angielski, hiszpański Europejska, Europejski francuski, niemiecki, włoski i japoński --- z jeszcze więcej języków na tap na rok 2011!

i teraz Nuance daje programistom swobodny dostęp - http://www.masshightech.com/stories/2011/09/26/daily13-Nuance-tweaks-mobile-dev-program-with-free-access-to-Dragon.html

iSpeech jest prawdopodobne, aby wspierać hiszpański - http://www.ispeech.org/developers/iphone

Telefony SDK iSpeech obsługują 27 TTS i ASR (zdefiniowane gramatyki) językach i 15 językach do rozpoznawania głosu w dyktowaniu swobodnym.

Yapme, przepraszam, nie jestem pewien - http://yapinc.com/speech-cloud.html

4

Spójrz tutaj: http://src.chromium.org/viewvc/chrome/trunk/src/content/browser/speech/

Jest to Przeglądarka Chrome Mowa szukać ...... można to zrobić w Objective-C. Spróbuj wejść na google.com w przeglądarce Chrome i jeśli hiszpański jest rozpoznawany, wygrywasz! :)

można łatwo używać:

- (void) SpeechFromGooglezzz { 
    NSURL *url = [NSURL URLWithString:@"https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=en-US"]; 

    ASIFormDataRequest *request = [ASIFormDataRequest requestWithURL:url]; 
    NSString *filePath = [NSString stringWithFormat:@"%@%@", [[NSBundle mainBundle] resourcePath], @"tmpAudio.flac"]; 

    NSData *myData = [NSData dataWithContentsOfFile:filePath]; 
    [request addPostValue:myData forKey:@"Content"]; 
    [request addPostValue:@"audio/x-flac; rate=16000" forKey:@"Content-Type"]; 
    [request startSynchronous]; 

    NSLog(@"req: %@", [request responseString]); 
} 

Pamiętaj, że musisz nagrywania 16000 bitrate pliku FLAC! Lub nic!

Google odpowiada jsonem zawierającym słowa.

mam nadzieję, że to pomoże.

+0

Rozumiem, że Google nie świadczy tych usług do celów komercyjnych, z wyjątkiem klientów Chrome i Androida. Nie zbudowałbym komercyjnej aplikacji wykorzystującej te API z IOS. Google może łatwo zamknąć Twoją aplikację. Jeśli jest to tylko prototyp lub eksperyment, możesz uciec od korzystania z usług Google, ale nie polegałbym na nich w celach komercyjnych. –

+0

Dobrze, ale Fernando nie określa, czy aplikacja jest komercyjna, czy nie! :) – elp

+0

Prawda, dobry link do obejrzenia: http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ –

1

Napisałem bibliotekę klienta dla interfejsów API Google Speech. Najlepiej działa z systemem iOS i obsługuje również inne systemy Unix, takich jak:

Edit: spróbuj tutaj: https://github.com/H2CO3/libsprec

Powiązane problemy