gpt4 book ai didi

audio - 如何比较两个音频数据?

转载 作者:行者123 更新时间:2023-12-05 00:34:21 25 4
gpt4 key购买 nike

我会录制我自己的声音并将它们保存为我的电脑中的 wav 文件。稍后我会说话,计算机应该将我的语音命令与预先存在/预先录制的 wav 文件相匹配。

问题:如何检查两个音频数据是否相等或两个音频之间有 80% 的匹配?

if(audio1 == audio2)
DO Task A
else if( audio1 is a bit similar to audio 2)
DO TASK B
else if( audio1 (80% match) audio 2)
DO TASK C
end if

比较两个音频数据的最佳方法是什么?

最佳答案

不幸的是,仅仅尝试直接比较音频波形,您不会很快到达任何地方。有大量关于语音和说话人识别的研究,如果您不熟悉基础知识,您只会重新发明轮子。我认为您在这里有多种选择,具体取决于您真正想做的事情

  • 开始阅读 HMM、DTW(如 learnvst 所述)和 Mel-frequency Cepstral Coefficients知道从哪里开始。
  • 使用现有的语音 API,例如 Microsoft one它负责低级信号处理,您可以将其构建到您的应用程序中
  • 使用更高级别的东西,例如 Windows Speech Recognition Macros这使您能够通过语音控制 PC 的各个方面(例如“播放紫色薄雾”)

  • 这取决于您是想了解低层次的语音处理(这将涉及大量数学),还是只需要很少编码即可工作的东西。

    关于audio - 如何比较两个音频数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10756214/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com