Was ist ein Protokoll -Mel -Spektrogramm??
Ein mel -Spektrogramm logarithmisch logarithmisch über einen bestimmten Schwellenwert (die Eckfrequenz) überträgt. Zum Beispiel im linear skalierten Spektrogramm liegt der vertikale Raum zwischen 1.000 und 2.000 Hz die Hälfte des vertikalen Raums zwischen 2.000 Hz und 4.000 Hz.
Ist openai flüsterfrei?
Openai hat kürzlich ein neues Spracherkennungsmodell namens Whisper veröffentlicht. Im Gegensatz zu Dalle-2 und GPT-3 ist Whisper ein kostenloses und Open-Source-Modell. Whisper ist ein automatisches Spracherkennungsmodell, das auf 680.000 Stunden mehrsprachiger Daten trainiert wurde, die aus dem Web gesammelt wurden.
Was ist Flüstern ai?
Whisper ist ein automatisches Spracherkennungssystem (ASR), das auf 680.000 Stunden mehrsprachiger und multitasking beaufsichtigter Daten aus dem Web geschult ist. Wir zeigen, dass die Verwendung eines so großen und vielfältigen Datensatzes zu einer verbesserten Robustheit gegenüber Akzenten, Hintergrundrauschen und technischer Sprache führt.