gpt4 book ai didi

audio - 哪个功能,算法最适合说话者验证

转载 作者:行者123 更新时间:2023-12-02 23:04:23 24 4
gpt4 key购买 nike

我的任务是扬声器验证

我的任务是计算两个音频语音之间的相似度,然后与阈值进行比较。
例如:两个音频之间的相似度分数是70%,阈值是50%。因此,说话者是同一个人。

语音是与文本无关的,可以是任何对话。

我已经尝试过使用MFCC,GMM进行说话人识别任务,但是这个任务是有区别的,只需比较两个音频功能就具有相似度。我不知道哪个功能适合说话者验证,哪个算法可以帮助我计算两种模式之间的相似度得分。

希望有你们的建议,

非常感谢。

最佳答案

这些天最先进的技术是xvectors:

Deep Neural Network Embeddings for Text-Independent Speaker Verification

在Kaldi中的实现是here

关于audio - 哪个功能,算法最适合说话者验证,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48393784/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com