- Was ist X -Vektor in der Spracherkennung?
- Was ist I-Vektor und D-Vektor??
- Was ist Ivektoren?
- Was ist universelles Hintergrundmodell?
Was ist X -Vektor in der Spracherkennung?
X-Vektoren sind die Einbettungen, die aus der ersten Schicht auf Segmentebene des DNN extrahiert wurden. Sie sind eine Darstellung des Audiosegments und eine Darstellung eines Sprechers, wenn sie über verschiedene Audiosegmente desselben Sprechers gemittelt werden.
Was ist I-Vektor und D-Vektor??
D-Vektor ist die gemittelte Aktivierung aus der letzten versteckten Schicht dieses DNN. Im Gegensatz zum I-Vektor-Framework hat dies keine Annahmen über die Verteilung der Funktion (das I-Vektor-Framework geht davon aus, dass der I-Vektor oder die latente Variable eine Gaußsche Verteilung aufweist).
Was ist Ivektoren?
Sein Ivektor [1], ein niedriger dimensionaler Vektor, der den Koordinat dieser Äußerung in einem akustischen Unterraummodell angibt. Wir zeigen. dass die Verteilung von Ivektoren einen Datensatz charakterisieren kann und. ermöglicht die Unterscheidung von Untergruppen von Äußerungen von verschiedenen Dosen-
Was ist universelles Hintergrundmodell?
Ein universelles Hintergrundmodell (UBM) ist ein Modell, das in einem biometrischen Verifizierungssystem verwendet wird, um allgemeine, personenunabhängige Merkmalsmerkmale darzustellen, die mit einem Modell personenspezifischer Merkmalseigenschaften verglichen werden, wenn sie eine Akzeptanz oder Ablehnung entscheiden.