Mam program z GrammarBuilders i Grammer, który jest używany w SpeechRecognitionEngine do rozpoznawania mowy. Czy zamiast rozpoznawać z audio, mogę użyć tej samej gramatyki, aby rozpoznać komendę (w ciągu znaków)? Coś jak CommandGrammar.parse (commandString)?Prosta gramatyka do rozpoznawania mowy
Odpowiedz
Powinieneś być w stanie użyć SpeechRecognitionEngine.EmulateRecognize, która pobiera tekst w miejsce dźwięku dla rozpoznawania mowy.
Nie jestem pewien co do zamierzonego zastosowania, ale jeśli będzie to używane na przykład do bota na czacie, który automatycznie wchodzi w interakcję z wprowadzaniem tekstu za pośrednictwem wiadomości błyskawicznych lub wiadomości SMS, uważam, że gramatyki są bardzo uciążliwe w utrzymaniu i ograniczeniu. Polecam coś takiego jak Artificial Intelligence Markup Language (AIML) do obsługi odpowiedzi tekstowych. Jest łatwy do opanowania i bardzo silny. Zamiast używać zwięzłych gramatyk wymaganych przez ASR, ten język pozwala używać symboli wieloznacznych, które znacznie bardziej sprzyjają wprowadzaniu tekstu. Istnieje nawet kilka C# open source projects, które udostępniają biblioteki do pracy z AIML i upraszczają tworzenie botów.
Zmieniono moją odpowiedź, aby uwzględnić metodę SpeechRecognitionEngine do wprowadzania tekstu. –
Dzięki za wskaźnik do tej metody. Używam go do testowania plików gramatycznych za pośrednictwem NUnit. –
- 1. Pisanie silnika rozpoznawania mowy
- 2. Boost :: Spirit - prosta gramatyka, przykład:
- 3. Hałas lub oprogramowanie do rozpoznawania mowy?
- 4. Prędkość rozpoznawania mowy firmy Microsoft
- 5. Najszybsza biblioteka rozpoznawania mowy C++
- 6. Wyłączyć wbudowane polecenia rozpoznawania mowy?
- 7. rozpoznawania mowy Google API Wynik jest pusty
- 8. Mechanizm rozpoznawania mowy o otwartym kodzie źródłowym
- 9. Czy usługa rozpoznawania mowy Android jest zajęta?
- 10. Czy mogę udostępnić publiczny interfejs API rozpoznawania mowy offline Androidowi?
- 11. Schemat rozpoznawania mowy dla iOS obsługujący język hiszpański
- 12. Czy można używać rozpoznawania mowy Androida bez wyświetlania okna dialogowego?
- 13. Automatyczne pobieranie języka rozpoznawania mowy w trybie offline na Androidzie
- 14. Korzystanie z interfejsów API rozpoznawania mowy Android od Google Glass
- 15. Jak korzystać z interfejsu API rozpoznawania mowy google w pythonie?
- 16. Zapisywanie danych wejściowych dźwięku z Androida Zdjęcie rozpoznawania mowy silnika
- 17. Dobry silnik rozpoznawania mowy dla komputerów Mac, a nie iOS?
- 18. Przechwytywanie wejście od OS X narzędzia rozpoznawania mowy
- 19. Ograniczenia korzystania z interfejsu API rozpoznawania mowy Google
- 20. Android: rozpoznawanie mowy
- 21. System.Speech.Recognition Wybór profilu rozpoznawania
- 22. Rozpoznawanie mowy na telefonie iPhone
- 23. C++ Rozpoznawanie mowy API
- 24. Gramatyka w interfejsie Google Web Speech API
- 25. Niejednoznaczna gramatyka
- 26. Makro do rozpoznawania WinRT?
- 27. synteza mowy mowy mowy webowej - uzyskanie listy głosowej
- 28. Wykrywanie mowy w języku Java API
- 29. Dodawanie Akcenty do syntezy mowy
- 30. Najlepsze artykuły do rozpoczęcia nauki rozpoznawania krawędzi/rozpoznawania obrazu
+1 Naprawdę ciekawy pomysł. A co z zamianą tekstu na mowę, a potem z mową na tekst? – Jason
Minął jakiś rok odkąd poważnie grałem z API rozpoznawania mowy (co w najlepszym wypadku okazało się prymitywne), więc może moje wrażenie i zrozumienie są po prostu nieaktualne, ale nie jest to celem posiadania gramatyk rozpoznawania mowy rozpoznać konkretny głos? Nie dostaniesz tego samego z tekstu. –
Nie, punktem dla tej instancji jest uzyskanie danych wejściowych opartych na logice, takich jak "wykonaj to za 30 sekund". Algorytm głosowy w tej chwili może sobie z tym poradzić, ale co, jeśli ktoś to napisze? Myślę, że powinien być dość łatwy sposób na zrobienie tego. Rozpoznawanie mowy przekształca je w tekst i WTEDY je analizuje, prawda? –