gpt4 book ai didi

javascript - 如何使用 WAMI 和 impress.js 创建语音控制的幻灯片?

转载 作者:行者123 更新时间:2023-11-30 18:33:56 26 4
gpt4 key购买 nike

我想使用 MIT 的 WAMI API(或其他语音识别 API)和 impress.js 创建语音控制的幻灯片。我想包含简单的命令,例如“下一页”或“返回”。

这可能吗?我该怎么做?

最佳答案

another post in stackoverflow问了一个非常相似的问题,但他们想使用谷歌的语音识别 API。那里对这个问题有一个很好的答案。

还有一个新的Speech API in Chrome可以使用。这个解决方案的问题是你必须点击一个图标来告诉语音识别引擎 (ASR) 开始收听,并且你的用户被限制在特定版本的 Chrome 上。大多数这些解决方案的工作方式是您必须单击图标才能获得用户的下一个话语。因此,一旦 ASR 有了命令,它就会识别出您必须再次单击该图标以告诉它再次收听。对于具有非常有限的命令集(即“下一步”和“后退”)的应用程序,这没有太大的值(value),因为用户单击告诉应用程序前进或前进的按钮同样容易回来。

看起来 WAMI API 可以让您以编程方式启动识别过程,这是一个更好的选择。这是一个 JavaScript API,您只需将其包含在您的网页中即可开始监听用户输入。 documentation for this API提供了有关如何开发多模式语音识别应用程序的良好示例。您将需要学习如何开发语法,以向语音引擎指定您在应用程序中寻找的话语。 WAMI 使用 JSpeech Grammar Format .一旦您从 ASR 中识别出“下一张”或“返回”,您只需使用 JavaScript 移至下一张或上一张幻灯片。

关于javascript - 如何使用 WAMI 和 impress.js 创建语音控制的幻灯片?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8845221/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com