- Wie viele MFCC -Koeffizienten sollte ich verwenden?
- Was ist die Ausgabe von MFCC??
- Was ist Hopfenlänge in MFCC?
Wie viele MFCC -Koeffizienten sollte ich verwenden?
In der Praxis werden die ersten 8–13 MFCC -Koeffizienten verwendet, um die Form des Spektrums darzustellen. Einige Anwendungen erfordern jedoch mehr Koeffizienten höherer Ordnung, um Tonhöhen- und Toninformationen zu erfassen. Beispielsweise können in der chinesischen Spracherkennung bis zu 20 Cepstral -Koeffizienten vorteilhaft sein [130].
Was ist die Ausgabe von MFCC??
Die Ausgabe nach dem Auftragen von MFCC ist eine Matrix mit Funktionsvektoren, die aus allen Frames extrahiert werden. In dieser Ausgangsmatrix repräsentieren die Zeilen die entsprechenden Frame-Nummern und Spalten entsprechende Merkmalsvektorkoeffizienten [1-4]. Schließlich wird diese Ausgangsmatrix für den Klassifizierungsprozess verwendet.
Was ist Hopfenlänge in MFCC?
MFCC hat zwei Argumente (die tatsächlich bis zur zugrunde liegenden STFT übergehen). Win_Length ist die Anzahl der in jedem Zeitrahmen enthaltenen Stichproben. Es ist standardmäßig 2048 oder ~ 93 ms bei 22 kHz sr. Hop_length ist die Anzahl der Beispiele zwischen aufeinanderfolgenden Fenstern. Der Standardwert beträgt 512 oder die 23 ms, die Sie berechnet haben.