Mam już FFT i wysokość + absolutna częstotliwość obliczana w czasie rzeczywistym z wejścia mikrofonu. Teraz chcę obliczyć barwę.Jak działają współczynniki Cepstrum częstotliwości częstotliwościowej?
Widziałem współczynniki Cepstrum Mel częstotliwości - MFCC, ale nie rozumiałem tego bardzo dobrze. Może ktoś mi dać kilka wskazówek na ten temat ..
tks za odpowiedź. Więc jeśli chcę uzyskać barwę, MFCC jest sposobem na prawo? –
Tak, myślę, że tak, szczególnie jako pierwszy atak na problem. Łatwo go wdrożyć, dużo o nim napisano i jest to standard, w stosunku do którego porównywane są inne podejścia (i zwykle ma się dobrze w tych porównaniach), więc jest to dobry wybór. – tom10
Na wiki algorytm to: 1. Wykonaj transformatę Fouriera (fragment okna) sygnału. 2. Odwzoruj moce widma otrzymanego powyżej na skalę melową, używając trójkątnych zachodzących na siebie okien. 3. Weź dzienniki mocy na każdej z częstotliwości mel. 4. Wykonaj dyskretną transformację cosinus z listy mocy mel log, tak jakby był sygnałem. 5. MFCC to amplitudy powstałego widma. Rozumiem wszystko, ale krok 2: użycie trójkątnych zachodzących na siebie okien Co powinienem zrobić, przekazać częstotliwość do melowej skali, ale co to jest trójkątnie zachodzące na siebie okno? –