5

Po prostu wpadłem na pomysł, który chcę rozwinąć w aplikację do rozróżniania/automatycznego wykrywania głosów od różnych ludzi.Czy istnieją już badania w zakresie rozpoznawania głosu, które umożliwiają odróżnienie głosu od różnych osób?

Przykładowy przypadek użycia: Po szkoleniu z Obamą i Romneya danych, aplikacja będzie w stanie wykryć, kiedy albo mówić ponownie (nie jest konieczne, ta sama treść z danymi szkoleniowej)

Zastanawiam się, czy są jakieś istniejące badania w tej sprawie. (Nie wiem jak tego szukać.) Wypróbowałem kilka słów kluczowych i nie uzyskałem znaczących wyników.)

Jeśli nie, jaki jest dobry sposób na rozpoczęcie? Jak wybrać funkcje, dane, modele itp.

Dzięki!

Odpowiedz

5

Znalazłem Speaker recognition na Wikipedii, która z kolei została połączona z An overview of text-independent speaker recognition: From features to supervectors (Kinnunen, Li, 2010).

Od streszczenie referatu:

Niniejszy dokument zawiera przegląd technologii automatycznego rozpoznawania głośnik, z naciskiem na niezależne rozpoznawania tekstu. Rozpoznawanie głośników było badane aktywnie od kilku dekad. Dajemy przegląd zarówno klasycznych, jak i najnowocześniejszych metod.

Powiązane problemy