gpt4 book ai didi

web - (连续)网络浏览器中有限单词的语音识别

转载 作者:行者123 更新时间:2023-12-02 02:22:02 26 4
gpt4 key购买 nike

语音识别有没有解决方案

  • 只有几个字(2 个就够了,10 个就不错了。100 个就很棒了。不需要更多)
  • 也在移动浏览器上运行(是否可以为此使用 flash(而不是 java)?)
  • 可以安装在您自己的服务器上。最好使用 PHP+MySQL(如果需要服务器端代码)

我尝试搜索,但只找到了实际的转录服务(例如 Android 版 Google 语音搜索)。

最佳答案

此类解决方案的一个示例是 touchless-timer , 这是基于 pocketsphinx.js (也在 Nikolay Shmyrev 的帖子中提到)。要回答您的要点:

  • 它支持约 60 个单词的简单闹钟语法(例如“五分钟后叫醒我”这样的短语);
  • 我已成功在 Chrome Beta 32.0.1700.99 Android 4.1.2(在三星 Galaxy S2 上)上运行它,它需要现代 Javascript 引擎,但不需要 Flash;
  • 它不需要服务器,因为语音识别是在 Javascript 中离线完成的,所有需要的文件都可以使用 ApplicationCache 缓存。

对于这个应用程序,语法写在Grammatical Framework中。并自动转换为pocketsphinx.js需要的有限状态模型和字典。对于简单的“MP3 播放/暂停”语法,您可以轻松地直接编写 FSA。

此应用程序中的英语声学模型不是很好,即它们可能会被后台播放的 MP3 弄糊涂。您可以通过训练更好的模型来改进它。然而,更好的模型可能更大(例如,Javascript 中 > 20 MB)并且不再适合内存或只会使应用程序运行/加载非常缓慢。

在移动设备上运行的应用程序的屏幕截图:

Screenshot of Timer running on a smartphone

关于web - (连续)网络浏览器中有限单词的语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7696703/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com