- Warum verwenden wir DCT in MFCC??
- Was extrahiert MFCC??
- Was ist die Ausgabe von MFCC??
- Wie wird MFCC bei der Spracherkennung verwendet??
Warum verwenden wir DCT in MFCC??
DCT ist der letzte Schritt des Hauptprozesses der MFCC -Feature -Extraktion. Das grundlegende Konzept von DCT besteht darin. Grundsätzlich ist das Konzept von DCT das gleiche wie die inverse Fourier -Transformation.
Was extrahiert MFCC??
Die MFCC -Feature -Extraktionstechnik enthält im Grunde genommen das Fenster des Signals, das Anwenden des DFT, das Aufnehmen des Protokolls der Größenordnung und das Verziehen der Frequenzen auf einer MEL -Skala, gefolgt von der Anwendung des inversen DCT.
Was ist die Ausgabe von MFCC??
Die Ausgabe nach dem Auftragen von MFCC ist eine Matrix mit Funktionsvektoren, die aus allen Frames extrahiert werden. In dieser Ausgangsmatrix repräsentieren die Zeilen die entsprechenden Frame-Nummern und Spalten entsprechende Merkmalsvektorkoeffizienten [1-4]. Schließlich wird diese Ausgangsmatrix für den Klassifizierungsprozess verwendet.
Wie wird MFCC bei der Spracherkennung verwendet??
MFCC sind beliebte Merkmale, die aus Sprachsignalen für die Verwendung in Erkennungsaufgaben extrahiert wurden. Im Sprachmodell des Quellfilters wird MFCC als Filter (Stimmtrakt) verstanden. Der Frequenzgang des Stimmtrakts ist relativ glatt, während die Quelle der Sprache als Impulszug modelliert werden kann.