Was ist der Zweck der Erkennung von Sprachaktivität in Sprachsystemen?
VAD, auch als Spracherkennung bekannt, zielt darauf ab, das Vorhandensein oder Fehlen von Sprache festzustellen und die Sprache von Nicht-Sprachabschnitten zu unterscheiden. In einer Vielzahl von sprachbasierten Anwendungen ist es wichtig, insbesondere bei Sprachcodierung und Spracherkennung.
Wie funktioniert Webrtc vad??
WEBRTC spaltet Audio in Frames, jeder Frame hat die entsprechende Zahl (0 oder 1). Wir verwenden 30 ms Frames für WEBRTC, sodass jeder 250 -ms -Stück in 8 Frames aufgeteilt ist.