- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在研究网络语音识别。
我发现谷歌向开发人员提供了一个调用“谷歌语音 API V2”的 API。但我注意到每天使用它是有限制的。
之后我发现有一个原生的WEB Speech API也可以实现语音识别。它只适用于谷歌浏览器和歌剧:
http://caniuse.com/#feat=speech-recognition
所以
1. Google Speech API 和 Web Speech API 有什么不同?他们有什么关系吗?
最佳答案
Web Speech API是 W3C 支持的规范,允许浏览器供应商提供他们选择的语音识别引擎(无论是本地的还是基于云的),该引擎支持您可以直接从浏览器使用的 API,而不必担心 API 限制等。你可以想象苹果可能会用 Siri 来驱动它,而微软可能会用 Cortana 来驱动它。同样,浏览器供应商可以选择在操作系统中使用内置听写软件,但这似乎不是目前的趋势。如果您尝试在浏览器中执行简单的语音合成(例如语音命令),这可能是最佳选择,尤其是随着采用率的增长。
Google Speech API是一种基于云的解决方案,允许您在浏览器之外使用 Google 的语音软件。它还提供更广泛的语言支持并可以转录更长的音频文件。如果您想转录 20 分钟的录音,这将是您要走的路。在撰写本文时,谷歌在此服务的第一小时后每记录 15 秒收取 0.006 美元的费用。
关于webspeech-api - Google Speech API 和 Web Speech API 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32517331/
有没有办法以编程方式列出可用的输入设备并允许更改当前用于 WebSpeech API 的输入设备? 我知道 Chrome 会在地址栏上显示一个视频图标,您可以在其中选择设备,但我想让此设置在网络应用程
google Chrome 扩展是否支持 Chrome 的 Web Speech 语音识别 API?我已经包含了一些 javascript 来创建语音识别对象,但是当我启动我的扩展程序时,没有提示我访
我一直在尝试通过 angularjs 使用 WebSpeech Api。一切似乎都有效,但模型不会立即更新。 如果我再次开始识别,模型就会更新。似乎某些内部循环/其他构造正在保持 Angular 以查
我一直在编写一个扩展程序,它允许用户发出语音命令来控制他们的浏览器,一切都很顺利,直到我遇到了一个灾难性的问题。它是这样的: 语音识别对象处于连续模式,并且每当 onerror: 'no-speech
我正在使用在此网站上找到的 Google WebSpeech API: https://developers.google.com/web/updates/2013/01/Voice-Driven-W
我正在研究网络语音识别。 我发现谷歌向开发人员提供了一个调用“谷歌语音 API V2”的 API。但我注意到每天使用它是有限制的。 之后我发现有一个原生的WEB Speech API也可以实现语音识别
我正在使用 WebSpeech 的 speechSynthesis 模块让网络应用程序说话。但是,您似乎只能将话语添加到队列中,然后对整个队列进行 pause()、resume() 和 cancel(
我是一名优秀的程序员,十分优秀!