Was ist VAD in der Spracherkennung?
6.1. Einleitung. Die Erkennung der Sprachaktivität (VAD) ist eine Technik, bei der das Vorhandensein oder Fehlen menschlicher Sprache erkannt wird. Die Erkennung kann verwendet werden, um einen Prozess auszulösen. VAD wurde in sprachgesteuerten Anwendungen und Geräten wie Smartphones angewendet, die mithilfe von Sprachbefehlen betrieben werden können.
Wie funktioniert Webrtc vad??
WEBRTC spaltet Audio in Frames, jeder Frame hat die entsprechende Zahl (0 oder 1). Wir verwenden 30 ms Frames für WEBRTC, sodass jeder 250 -ms -Stück in 8 Frames aufgeteilt ist.