gpt4 book ai didi

speech-recognition - "Voice trigger"检测

转载 作者:行者123 更新时间:2023-12-01 03:00:36 25 4
gpt4 key购买 nike

我有一个语音应用程序,如果能够使用“触发词”开始录制音频,它将得到很大改进。我不需要完整的语音文本引擎,只需要可靠/有效检测触发词的能力。

我想知道是否有任何专门的语音引擎支持这个特定的用例,或者任何库/方法来开发这样一个单一用途的检测引擎。理想情况下,我希望它在嘈杂的环境中工作,但它可以针对单个用户的声音进行训练。

研究论文/主题的指针也将不胜感激,所以我知道要问什么。

最佳答案

我在 Red5 项目中的一位同事使用触发词创建了一个类似的演示,以导致针对图像存储库运行搜索。说“猫”会导致猫的图像在大约一秒钟内出现。客户端应用程序是用 Flash 编写的,后端使用免费的 Sphinx 库在 Red5 上运行。您当然可以毫不费力地使用 Sphinx 做您想做的事。

狮身人面像项目:http://cmusphinx.sourceforge.net/sphinx4/

关于speech-recognition - "Voice trigger"检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/901928/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com