- Was ist Mel Scale Filter Bank?
- Wie viele MFCC -Koeffizienten gibt es?
- Was ist MFCC in Audio?
- Was nutzt die Melfrequenz -Cepstralkoeffizienten MFCC?
Was ist Mel Scale Filter Bank?
Das Design Mel Filter Bank Block gibt eine Hörfilterbank der Frequenz-Domänen unter Verwendung der MEL-Frequenzskala aus. Sie können eine MEL -Filterbank verwenden, um ein Audiosignal in separate Frequenzbänder in der MEL -Frequenzskala zu zerlegen, was die nichtlineare menschliche Wahrnehmung des Klangs nachahmt.
Wie viele MFCC -Koeffizienten gibt es?
In der Praxis werden die ersten 8–13 MFCC -Koeffizienten verwendet, um die Form des Spektrums darzustellen. Einige Anwendungen erfordern jedoch mehr Koeffizienten höherer Ordnung, um Tonhöhen- und Toninformationen zu erfassen.
Was ist MFCC in Audio?
In der Schallverarbeitung ist das Mel-Frequenz-Cepstrum (MFC) eine Darstellung des Kurzzeitleistungspektrums eines Schalls, basierend auf einer linearen Cosinus-Transformation eines logarithmischen Leistungsspektrums auf einer nichtlinearen Mel-Skala der Frequenz. Melfrequenz-Cepstral-Koeffizienten (MFCCs) sind Koeffizienten, die gemeinsam einen MFC ausmachen.
Was nutzt die Melfrequenz -Cepstralkoeffizienten MFCC?
Das Frequenzdomänensignal wird in ein Zeit-Domänen-Signal umgewandelt, und die Merkmale werden auch als MEL-Maßstab Cepstral-Koeffizienten oder Melfrequenz-Cepstral-Koeffizienten bezeichnet, die zur Spracherkennung verwendet werden [3]. Diese Technik wird auch häufig zur Spracherkennung verwendet.