2009-10-24 13 views

Odpowiedz

7

MFCCs połączyć rozważenie aspektów ludzkiego słuchu (logarytmiczna percepcja częstotliwość, tym mel scale) i fizyka instrumentów muzycznych (systemy te często mają dobrze zdefiniowane Overtones które są harmonic - który dlatego MFCC używają FFT z FFT), aby dać uproszczoną reprezentację barwy instrumentu (gdzie podstawowa częstotliwość i głośność są brane pod uwagę).

Można pisać niekończące się strony na ten temat, a jest wiele dostępnych w Internecie, więc bardziej szczegółowe pytanie, które dokładnie wyjaśni, co chcesz wiedzieć, byłoby pomocne. Algorytm obliczania MFCC znajduje się na górze wikipedia page.

+0

tks za odpowiedź. Więc jeśli chcę uzyskać barwę, MFCC jest sposobem na prawo? –

+1

Tak, myślę, że tak, szczególnie jako pierwszy atak na problem. Łatwo go wdrożyć, dużo o nim napisano i jest to standard, w stosunku do którego porównywane są inne podejścia (i zwykle ma się dobrze w tych porównaniach), więc jest to dobry wybór. – tom10

+0

Na wiki algorytm to: 1. Wykonaj transformatę Fouriera (fragment okna) sygnału. 2. Odwzoruj moce widma otrzymanego powyżej na skalę melową, używając trójkątnych zachodzących na siebie okien. 3. Weź dzienniki mocy na każdej z częstotliwości mel. 4. Wykonaj dyskretną transformację cosinus z listy mocy mel log, tak jakby był sygnałem. 5. MFCC to amplitudy powstałego widma. Rozumiem wszystko, ale krok 2: użycie trójkątnych zachodzących na siebie okien Co powinienem zrobić, przekazać częstotliwość do melowej skali, ale co to jest trójkątnie zachodzące na siebie okno? –

Powiązane problemy