gpt4 book ai didi

iphone - 如何在 iOS 上比较两个语音样本?

转载 作者:可可西里 更新时间:2023-11-01 04:40:36 26 4
gpt4 key购买 nike

首先,我想声明我的问题不是关于语音识别的“经典”定义。

我们尝试做的事情有些不同,在以下方面:

  1. 用户记录他的命令
  2. 稍后,当用户说出预先录制的命令时,就会发生特定的 Action 。

例如,我录制了一个调用妈妈的语音命令,所以我点击她并说“妈妈”。然后当我使用该程序并说“妈妈”时,它会自动调用她。

我如何将口头命令与保存的语音样本进行比较?

编辑:我们不需要任何“文本到语音”的能力,只需要比较声音信号。显然,我们正在寻找某种现成的产品或框架。

最佳答案

用于音乐识别的一种方法是对两个有问题的声音采用频谱的时间序列(时间窗 STFT FFT),在时间轴上绘制频率峰值的位置,并将匹配的两个 2D 时频峰值映射。这比仅将 2 个声音样本互相关更稳健,因为峰值变化远小于频谱峰值之间的所有频谱“cruft”。如果两个话语的速率和音高没有太大变化,这种方法会更好。

在 iOS 4.x 中,您可以使用 FFT 的 Accelerate 框架,也可以使用 2D 互相关。

关于iphone - 如何在 iOS 上比较两个语音样本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5555418/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com