gpt4 book ai didi

java - 如何检测音频流中特定单词的出现。

转载 作者:行者123 更新时间:2023-12-02 09:02:51 26 4
gpt4 key购买 nike

起初我以为它会像图像识别一样简单。

创建 FANN hopfield 网络,而不是用二进制转换后的图像来训练/为其提供数据,并用二进制转换后的声音为其提供数据。

但是:

  1. 如何将 wav 转换为二进制字符串(我相信我需要二进制而不是字节 - 我是对的吗?)
  2. 如何使其连续,我的意思是计算来自麦克风作为源的单词/声音的出现次数。
  3. 执行此操作的最佳 Java 库是什么(不是 SPHINX 或其他语音识别库 - 我想让我的代码语言独立,甚至识别自定义声音 - 例如拍手)

我之前使用 FANN 进行图像识别,并且我了解 Encog,但也许有更好的东西(或更简单,我实际上不明白如何使用 Encog)和更好的 Java native ,以便轻松移植到移动设备

最佳答案

如果您已经能够使用图像,也许这就是您所需要的: http://code.google.com/p/asperes/

它可以将WAV声音样本转换为BMP图像(频谱图)以及将任意BMP图像转换为声音(WAV)。

文档中的描述:

音频频谱图和重新合成 (ASPERES) 是一个小型命令行实用程序,可以从声音样本生成图像(频谱图),以及从任意图像生成声音。

关于java - 如何检测音频流中特定单词的出现。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12546862/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com