20

Zajmuję stronę internetową, i chciałbym, aby pomóc osobom niewidomym go używać przez głos, więc użyję:JavaScript mowy na tekst dla osób niewidomych

  • Text-to-speech , aby podać kilka możliwości wykorzystania karty użytkownikowi
  • mowy na tekst, aby umożliwić użytkownikowi używać swojego głosu, aby wybrać jedną

mam już pewne JavaScript bibliotek text-to-speech (jak speak.js), ale teraz potrzebuję dobrej mowy w tekście. Istnieje kilka rozwiązań do tego celu (takich jak speechapi), ale używają apletów Java lub Flasha i chcę polegać wyłącznie na JavaScript, aby uniknąć wtyczek.

Próbuję wprowadzić mowę HTML5 za pomocą x-webkit-speech i Google Chrome, i to dobrze, ale musisz kliknąć ikonę (a niewidomi nie mogą dobrze używać myszy). Czy możliwe jest użycie x-webkit-speech naciśnięcie klawisza? Czy znasz jakieś alternatywne API (JavaScript)?

Dziękujemy!

+0

+1 doskonałe pytanie – Blaster

+3

Czy nawigacja głosowa nie powinna być częścią przeglądarki zamiast strony internetowej? – Bergi

+1

@Bergi Nawigacja może być odpowiedzialnością przeglądarki, ale moja strona jest bardziej złożona. Ma proste gry, które poprawiają twoje zdolności mózgowe, a moim zamiarem jest zaadaptowanie niektórych z nich do niewidomych, aby przeglądarka nie mogła zarządzać grami HTML5. – sgmonda

Odpowiedz

2

Tłumacz Google to bardzo dobry silnik tekstowy do mowy. Zwykłem czytać z nim tekst. Na przykład masz tekst: welcome to Stack overflow można nazwać tak

http://translate.google.com/translate_tts?ie=UTF-8&q=Welcome%20to%20stack%20overflow&tl=en&total=1&idx=0&textlen=23&prev=input 

następnie użyć dźwięku przeglądarki, aby odtworzyć go

dla wejścia mowy można aktywować obsługi procesu słuchania, zobacz tutaj http://code.google.com/chrome/extensions/experimental.speechInput.html

+0

Ale wtedy użytkownik musiałby zainstalować rozszerzenie dla Chrome. Jest to możliwe, ale nie chciałbym polegać na rozszerzeniu. Najlepiej, gdyby użytkownik musiał otworzyć swoją przeglądarkę (teraz Chrome jest jedynym, który obsługuje wejścia głosowe, ale jest to zgodne ze specyfikacją HTML5, więc przeglądarka wesprze go z czasem) – sgmonda

3

Czy możliwe jest użycie x-webkit-speech naciśnięcie klawisza?

Zgodnie z tym post i tym post nie można przesłonić początku mowy, klikając mikrofon.

Co robi x-webkit-speech to używanie funkcji przechwytywania dźwięku w HTML5 i wysyłanie dźwięku na serwery Google w celu przetworzenia i zwrócenie wyników w JSON. To jest blogger has reversed engineered it. Możesz utworzyć bibliotekę JavaScript, która wyszuka naciśnięcie klawisza, aby rozpocząć przechwytywanie dźwięku w przeglądarkach obsługujących HTML5 i wysłać go do usługi Google lub do utworzonej przez Ciebie. Minusem korzystania z usługi Google jest to, że jest to nieobsługiwany interfejs API i może ulec zmianie w dowolnym momencie. Minusem rozwoju własnej usługi jest to, że jej opracowanie i utrzymanie może być kosztowne.

Czy znasz jakieś alternatywne API (JavaScript)?

Ten post i ten post wymienia niektóre usługi dostępne dla rozpoznawania mowy. Nie widziałem listy Nuance. Możesz użyć do tego celu Dragon Mobile SDK. Możesz sprawdzić w ISpeech.

Powiązane problemy