gpt4 book ai didi

java - 边唱歌边连续语音识别?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:24:42 25 4
gpt4 key购买 nike

作为我的应用程序的一部分,我希望添加语音识别,但不是传统意义上的。我有一堆由某人演唱的歌词(分为经文),我的想法是找到当前正在演唱的经文,以便可以在屏幕上显示。

我玩过 sphinx 并得到了一些基本的示例设置和工作,但是虽然似乎有很多关于注册语音文本的文档,您可以在其中等待延迟然后处理结果,但我不能发现很多关于连续识别句子的想法。这当然是在我开始唱这些词而不是说这些词之前!

有没有人有这方面的经验,如果有的话,有什么地方可以提供一个很好的起点吗?或者是我试图用狮身人面像实现的目标太过雄心勃勃,而且它永远不会真正正常工作吗?我愿意查看其他库,但它们必须是免费的,而 sphinx 是我能找到的讨论最广泛的库。

最佳答案

完全有可能在发音稍有延迟后立即识别语音。此外,如果您或多或少了解您期望得到什么。这称为“部分结果”,可通过 API 在所有 CMUSphinx 解码器中使用。基本上你可以检索过程中的假设。

关于如何稳定这个结果(如何提取它的稳定部分)有一个小问题需要考虑,但这种技术称为回溯并且可以很容易地实现

对于唱歌来说,如果可以过滤掉音乐也是可以的。

关于java - 边唱歌边连续语音识别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7161663/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com