gpt4 book ai didi

node.js - 语音识别,nodeJS

转载 作者:搜寻专家 更新时间:2023-10-31 22:19:17 25 4
gpt4 key购买 nike

由于连接到不同的 API,我目前正在开发一种工具,允许我阅读我的所有通知。

它工作得很好,但现在我想发出一些声音命令来执行一些操作。

就像当软件说“一封来自 Bob 的邮件”时,我想说“阅读”或“存档”。

我的软件是通过 Node 服务器运行的,目前我没有任何浏览器实现,但它可以是一个计划。

在 Node JS 中启用语音到文本的最佳方式是什么?

我已经看到很多关于它的线程,但主要是它使用浏览器,如果可能的话,我想在一开始就避免它。可能吗?

另一个问题是某些软件需要输入 wav 文件。我没有任何文件,我只希望我的软件始终听我说的话,以便在我说出命令时使用react。

你有关于我如何做到这一点的任何信息吗?

干杯

最佳答案

这里的两个答案都已经很好了,但我认为您正在寻找的是 Sonus .它会为您处理音频编码和流式传输。它始终离线收听可定制 热词(如 Siri 或 Alexa)。您还可以以编程方式触发监听。结合 say 这样的模块,您可以通过执行以下操作来启用您的示例:

say.speak('One mail from Bob', function(err) {
Sonus.trigger(sonus, 1) //start listening
});

您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
通知。最新的。”和“发送消息。你今天好吗”

将它扔到 Pi 或 CHIP 上,并在你的 table 上放一个麦克风,你就有了一个私有(private)助理来读取你的通知并对命令使用react。

简单的例子:
https://twitter.com/_evnc/status/811290460174041090

有点复杂:
https://youtu.be/pm0F_WNoe9k?t=20s

完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md

免责声明:这是我的项目:)

关于node.js - 语音识别,nodeJS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35643347/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com