gpt4 book ai didi

audio - 自动语音匹配的开源?

转载 作者:行者123 更新时间:2023-12-02 22:29:01 25 4
gpt4 key购买 nike

自动语音匹配不是自动语音识别,它是比较两个语音音频信号并返回这两个音频信号匹配的百分比。

通常,这种技术的使用方式如下:

  • 发音学习,例如,有一个标准的发音信号“Hello”,对于正在学习英语的学生,他们自己发音“Hello”,因此我们需要使用ASM技术来比较学生发音的相似度或正确性。因此,我们需要找出一种算法来比较这两个一维音频信号。

  • 2.我们可以从单个单词的上方扩展到一个句子。那么如何匹配这些音频信号呢?

    这里的问题是寻找ASM的一些好的开源或商业解决方案。

    或其他任何适合此类实际需求的好的解决方案?

    提前致谢 !

    最佳答案

    与模板的比较不会带来任何好处,因为它实际上不会暗示说错了什么。好的语音学习框架与模板不匹配,但与代表正确和错误发音的声学模型不匹配。这样,它可以检测出学习者的语音错误。你可以阅读

    SRI EduSpeakTM系统:识别和发音评分
    http://www.speech.sri.com/people/hef/papers/EduSpeak.ps

    要在iPhone上实现此算法,您可以检查

    http://ottercall.com

    关于audio - 自动语音匹配的开源?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8411235/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com