2009-10-28 19 views
5

Chcę utworzyć algorytm Cepstrum z częstotliwością Mel, ale są pewne rzeczy, których nie rozumiem.Jak wykonać algorytm MFCC?

Po zakończeniu FTT musimy "odwzorować moce widma otrzymanego powyżej na skalę melową za pomocą trójkątnych zachodzących na siebie okien".

Wiem, jak obliczyć trójkąty i wiem również, jak przejść do skali mel. Po prostu nie wiem, co z nimi zrobić.

Jeśli zdefiniowano trójkąty, w jaki sposób odwzorować moc uzyskanego widma na skalę melową?

Czy to tak: Suma częstotliwości wewnątrz trójkąta, a następnie przekazać go do melaminy? lub Suma częstotliwości wewnątrz trójkąta zgodnie z wartością ciężaru (zdefiniowaną przez wysokość trójkąta w tym punkcie), a następnie przekazać ją do skali melowej? lub Przepuścić wszystkie częstotliwości w trójkącie, aby skalować melodię zgodnie z wartością weim? Inna sprawa?

Czy ktoś mi to wyjaśnia

+1

Moja sugestia to bycie prostym i łaskawym członkiem społeczności. Przestań publikować pod różnymi nazwami użytkowników (Andre, Andre Ferreira i aF); dziękuję ludziom za pomoc przy poprzednich trzech podobnych pytaniach, aw razie potrzeby przegłosuj i zaakceptuj ich odpowiedzi (to bieżące pytanie jasno wynika z moich wcześniejszych odpowiedzi, ale nie ma potwierdzenia ani wznowienia); i bądź uczciwy (nie odpowiadaj na własne pytania tak, jakbyś był kimś innym). W przypadku takich pytań jest to bardzo mała społeczność. W przeciwnym razie, zapłać komuś, kto ci pomoże ... czy chciałbyś poznać moje stawki? – tom10

+0

Byłem niezarejestrowany i nie uzyskałem żadnego dostępu po wylogowaniu. Naprawdę nie bardzo dobrze rozumiem tę część i jestem wdzięczny za to, co powiedziałeś do tej pory. Proszę, możesz mi pomóc w ogóle to zrozumieć? Przeczytałem już wiele rzeczy, ale tej części naprawdę nie rozumiem. –

+0

Pewnie. 1) Oznaczanie pytań jest bardzo ważne. Myślę, że zachęcam więcej osób, aby zobaczyły twój tag z pytaniem "FFT" i "przetwarzanie sygnału".2) osoby z SO są motywowane pomaganiem ludziom i zdobywaniem punktów, więc uprzywilejuj rzeczy, które lubisz, klikając strzałkę przez pytanie lub odpowiedź i zaakceptuj odpowiedź na własne pytanie, które działa dla ciebie (kliknij na czeku, I myśleć). 3) śledź na własne pytania, nawet po tym, jak odpowiedzą, aby ludzie czuli się uznani. – tom10

Odpowiedz

5

Myślę, że ten etap procesu jest trochę dziwne i nie dokonała pełnego sensu (dla mnie w każdym razie). Środek pasm filtrów jest równomiernie rozmieszczony wzdłuż skali mel, ale są to trójkąty w skali liniowej, to jest podobnie jak na figurze here.

Następnie obliczyć ważoną sumę za pomocą tych trójkątów wzdłuż liniowej osi X. (W poprzednim kroku uważam, że niektóre podejścia normalizują się w obszarze trójkąta filtrującego, a niektóre nie, i nie mam pewności co do ostatecznych konsekwencji tutaj, choć podejrzewam, że to nie znaczy dużo poza modyfikacją końcowa interpretacja, które są względnymi porównaniami i tak, jeden zachowuje całkowitą energię, a drugi daje równe ważone składki na pasmo.) Następnie weź log tego (który zamienia ogólny współczynnik objętości na przesunięcie).

Edit: Aby być bardziej jasne, o stosowaniu filtrów ... Każdy trójkąt reprezentuje odrębny filtr, tworząc odrębną sumę ważoną. Jeśli w banku filtrów znajduje się dwadzieścia filtrów, do obliczenia będzie dwadzieścia trójkątów i dwadzieścia ważonych sum. Aby zastosować każdy filtr, dla każdej wartości osi X należy ustawić wartość filtra w tej lokalizacji x według wartości funkcji w tej lokalizacji x, i dodać ją do sumy dla danego filtru. Większość wartości osi X posiada dwa filtry, które są tam obecne, więc w każdym miejscu x przyczynia się do dwóch filtrów.

+0

Poprawiłem moją odpowiedź, aby odpowiedzieć na twoje pytanie, mam nadzieję. Jeśli nie, proszę bardzo starannie ułóż pytanie, aby zrozumieć, co jest niejasne. – tom10

+0

Ponadto, prawdopodobnie nadal możesz zaakceptować moją odpowiedź, nawet bez 15 punktów. To nie tak, że umieram, żeby zdobyć punkty, to naprawdę więcej, żeby cię zaangażować, ale zobacz to ... http://meta.stackexchange.com/questions/8396/how-do-i-accept-an -answer-where-do-i-click Ale nie akceptuj tego przez około jeden dzień, więc więcej osób zobaczy to pytanie i może ktoś będzie miał coś pouczającego do powiedzenia. – tom10

+0

Jeszcze raz dziękuję! Oczywiście akceptuję twoją odpowiedź. Byłeś dla mnie wspaniały. Ostateczna wątpliwość dotyczy konwersji z częstotliwości na melanżę. Dokonuje się tego stosując filtry i sumę wag? lub Potrzebuję zrobić coś takiego: http://en.wikipedia.org/wiki/Mel_scale w dowolnym miejscu? –