- Wie erklären Sie MFCC?
- Was machen MFCCs??
- Wie wird MFCC bei der Spracherkennung verwendet??
- Warum wird MFCC für die Feature -Extraktion verwendet??
Wie erklären Sie MFCC?
Die MEL-Frequenz-Cepstral-Koeffizienten (MFCCs) eines Signals sind ein kleiner Satz von Merkmalen (normalerweise ca. 10-20), die die Gesamtform einer Spektralhülle präzise beschreiben. In Mir wird es oft verwendet, um Timbre zu beschreiben.
Was machen MFCCs??
MFCCs werden üblicherweise als Merkmale in Spracherkennungssystemen verwendet, wie z. B. die Systeme, die automatisch in einem Telefon gesprochenen Zahlen erkennen können. MFCCs finden auch zunehmend Anwendungen in Musikinformationsanwendungen wie Genreklassifizierung, Audio -Ähnlichkeitsmaßnahmen usw.
Wie wird MFCC bei der Spracherkennung verwendet??
MFCC sind beliebte Merkmale, die aus Sprachsignalen für die Verwendung in Erkennungsaufgaben extrahiert wurden. Im Sprachmodell des Quellfilters wird MFCC als Filter (Stimmtrakt) verstanden. Der Frequenzgang des Stimmtrakts ist relativ glatt, während die Quelle der Sprache als Impulszug modelliert werden kann.
Warum wird MFCC für die Feature -Extraktion verwendet??
Es wird beobachtet, dass das Extrahieren von Merkmalen aus dem Audiosignal und die Verwendung als Eingabe in das Basismodell eine viel bessere Leistung erzeugt als direkt unter Berücksichtigung des Roh -Audiosignals als Eingang. MFCC ist die weit verbreitete Technik zum Extrahieren der Merkmale aus dem Audiosignal.