gpt4 book ai didi

neural-network - i-vector 和 d-vector 的区别

转载 作者:行者123 更新时间:2023-12-04 02:55:04 27 4
gpt4 key购买 nike

有人可以解释一下 i-vector 和 d-vector 之间的区别吗?我对它们的了解是它们广泛用于说话人/语音识别系统,它们是表示说话人信息的模板,但我不知道主要区别。

最佳答案

I-vector 是表示帧级特征分布模式的特质特征的特征。 I-vector提取本质上是GMM超向量的降维(虽然在计算i-vector时没有提取GMM超向量)。它的提取方式与特征语音自适应方案或 JFA 技术类似,但按句子(或输入语音样本)提取。

另一方面,d-vector 是使用 DNN 提取的。为了提取 d 向量,训练了一个 DNN 模型,该模型采用堆叠滤波器组特征(类似于 ASR 中使用的 DNN 声学模型)并在输出上生成单热说话人标签(或说话人概率)。 D-vector 是来自这个 DNN 的最后一个隐藏层的平均激活。因此,与 i-vector 框架不同,它没有关于特征分布的任何假设(i-vector 框架假设 i-vector 或潜在变量具有高斯分布)。

所以总而言之,这是从完全不同的方法或假设中提取的两个不同的特征。我建议你阅读这些论文:

N. Dehak、P. Kenny、R. Dehak、P. Dumouchel 和 P. Ouellet,“说话人验证的前端因素分析”,IEEE 音频、语音和语言处理交易,卷。 19,没有。 4,第 788-798 页,2011 年。

E. Variani、X. Lei、E. McDermott、I. L. Moreno 和 J. G-Dominguez,“用于小足迹文本相关说话人验证的深度神经网络”,Proc。 ICASSP,2014 年,第 4080-4084 页。

关于neural-network - i-vector 和 d-vector 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37508698/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com