Die Ausgabe nach dem Auftragen von MFCC ist eine Matrix mit Funktionsvektoren, die aus allen Frames extrahiert werden. In dieser Ausgangsmatrix repräsentieren die Zeilen die entsprechenden Frame-Nummern und Spalten entsprechende Merkmalsvektorkoeffizienten [1-4].
Was misst MFCC?
Die MEL-Frequenz-Cepstral-Koeffizienten (MFCCs) eines Signals sind ein kleiner Satz von Merkmalen (normalerweise ca. 10-20), die die Gesamtform einer Spektralhülle präzise beschreiben. In Mir wird es oft verwendet, um Timbre zu beschreiben.
Wie visualisieren Sie in MFCC?
Matplotlib mit Python
Berechnen Sie MFCC -Funktionen aus einem Audiosignal. Erstellen Sie eine Figur und eine Reihe von Nebenhandlungen. Zeigen Sie die Daten als Bild an, ich.e., auf einem 2D -regulären Raster. Verwenden Sie zur Anzeige der Abbildung show () Methode.
Was ist MFCC in der Spracherkennung?
Melfrequenz-Cepstrum-Koeffizienten (MFCC)
Im Sprachmodell des Quellfilters wird MFCC als Filter (Stimmtrakt) verstanden. Der Frequenzgang des Stimmtrakts ist relativ glatt, während die Quelle der Sprache als Impulszug modelliert werden kann.