gpt4 book ai didi

c# - 人声识别/识别

转载 作者:行者123 更新时间:2023-11-30 14:00:54 32 4
gpt4 key购买 nike

我想录下某人的声音,然后根据我获得的关于他/她声音的信息,如果那个人再次说话,我就能认出来!问题是我没有关于哪些统计数据(如频率)导致人声差异的信息,如果有人可以帮助我如何识别某人的声音?

在研究过程中,我发现了各种关于语音识别的库,但它们无法帮助我,因为我的问题非常简单!我只想认出说话的人不是他在说什么。

最佳答案

你描述的问题并不简单,因为同一个人的声音听起来可能不同(例如,如果这个人感冒等)和/或如果这个人说话声音更大/更快/更慢等。

另一点是与其他声音(背景、其他声音等)的分离。

录制声音的设备的质量非常重要 - 有些系统使用多个麦克风来取得良好的效果......

总的来说,这不是一件容易的事 - 尤其是。如果您想获得良好的检测率。

基本上实现这个的方法是:

  • 实现稳健的声音分离
  • 实现强大的声音/语音模式提取
  • 根据理想的声音设置创建一个数据库,其中包含您要识别的声音的指纹
  • 定义一种算法,用于比较您存储的指纹和提取/归一化的声音/语音模式(有一些“可能相等”的阈值等可能是必要的...)
  • 改进您的算法,直到达到可接受的检测率(还要考虑误报率!)

有关详细概述,请参阅 http://www.scholarpedia.org/article/Speaker_recognition

关于c# - 人声识别/识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9565082/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com