gpt4 book ai didi

audio - 创建自定义声音识别软件以切换音频的建议

转载 作者:行者123 更新时间:2023-12-03 02:25:46 24 4
gpt4 key购买 nike

我需要开发一个程序,当它识别鹦鹉尖叫或尖叫时打开或关闭特定的音轨。该软件需要识别特定范围的声音并允许该范围内的一些变化(因为鹦鹉可能不会每次都完全复制它的尖叫声)。

示例:鸟叫声,没有声音。鸟停止尖叫五秒钟,赞美鸟的音轨播放。定期喋喋不休需要完全忽略,因为它不会被气馁。

我听说过具有内置词典的语音识别功能的 Java 库,但是需要教授该软件我的特定鹦鹉发出的特定声音 - 而不是单词或任何随机的鸟声。此外,正如我上面提到的,它需要允许声音的轻微变化,因为尖叫声可能永远不会与录制的版本 100% 相同。

什么是最好的方法来解决这个问题/我应该研究什么语言?

编辑:或者(也许这将是一个更简单的解决方案),有没有办法根据输入音量进行音频切换?所以鹦鹉发出什么样的声音并不重要,它的声音有多大?

最佳答案

这个问题似乎与语音识别密切相关。我建议看一下这篇文章:How to convert human voice into digital format?

关于audio - 创建自定义声音识别软件以切换音频的建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5229899/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com