speech-recognition - 谷歌语音 API-6ren

speech-recognition - 谷歌语音 API

转载作者：行者123 更新时间：2023-12-03 10:39:34

24

4

关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。

想改进这个问题？将问题更新为 on-topic对于堆栈溢出。

6年前关闭。

Improve this question

我现在正在处理我的项目，并且即将为台式计算机构建一个类似 Siri 的应用程序。我在想 Google Speech API 对于语音识别是否可靠且准确？你能建议我在语音识别方面哪个语音 API 最准确吗？最好是免费的 API。谢谢你。

最佳答案

虽然 Google 语音 API 是免费的，但它不是官方的公共(public) API。有些人对其进行了逆向工程，如discussed in this blog .如果您计划直接访问商业产品的 API，我不会推荐它，因为他们可以在没有警告的情况下删除或更改它，从而破坏您的产品。这最近发生在使用 Google Weather API 的开发人员身上。 .如果您通过 Chrome 浏览器使用 x-webkit-speech 访问它另一方面，您可能是安全的，因为它受 Google 支持。谷歌的语音识别与许多更流行的商业解决方案一样。他们在其他项目中拥有丰富的经验，例如 Google Voice 和现已解散的 Google 411。他们有一些顶尖的语音科学家为他们工作。我能想到的唯一其他免费选择是Sphinx这是卡内基梅隆大学的一个开源项目。使用此解决方案的学习曲线陡峭，如果您希望将其设置为服务，则必须自己开发。 Nuance是语音识别市场的另一个大玩家(我相信这是 Siri 使用的)，他们确实有提供语音识别服务的解决方案。但它们很贵。

更新语言支持评论的答案

Windows 语音识别支持其他语言，大多数语音识别系统也是如此。但需要注意的是，您必须告诉系统要使用哪种语言，并且它必须支持相关语言。每个供应商都有一个它支持的语言列表，并且它们特定于一个地区。例如，供应商可能支持墨西哥西类牙语、美国西类牙语和西类牙西类牙语；它们都有略微不同的方言。但是语音识别引擎在每个用户的计时器上只能支持一种语言/方言。如果不首先请求将其更改为该语言，用户就无法对语音识别系统说多种语言。

2014 年 3 月 17 日更新

由于其他浏览器缺乏支持，x-webkit-speech 输入字段已被弃用。这将替换为 Web Speech API ，这是一个javascript API。您可以找到 example on how to use it here .

关于speech-recognition - 谷歌语音 API，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12721436/

24

4

0

文章推荐： database-design - Trello 如何如此快速地显示历史？

文章推荐： jshint - 如何使用 JSHint 显示所有错误

文章推荐： ruby-on-rails - 使用 Capistrano 在 Heroku 上部署？

文章推荐： windows-8 - Surface rt 的用户代理字符串是什么？

speech-recognition - Microsoft.Speech.Synthesis 不适用于文本转语音但 System.Speech.Synthesis 有效。为什么？
我只是尝试使用 Microsoft.Speech.dll; 为文本转语音运行简单的 Microsoft 示例 using System; using Microsoft.Speech.Synthesi
speech-recognition - Microsoft Speech 产品/平台之间的差异
微软似乎提供了不少语音识别产品，我想知道它们之间的区别。有Microsoft Speech API ，或 SAPI。但不知何故Microsoft Cognitive Service Speech A
speech-recognition - 各种 Microsoft Speech 技术之间的差异
我希望编写一个应用程序，将语音到文本转换为仓库应用程序，反之亦然。主要用例是运算符(operator)将在仓库中佩戴耳机并将指令发送回服务器并从仓库软件接收指令以拣选和打包订单。我们将使用由 Wind
speech-recognition - 如何在python中使用google cloud speech api
我正在探索 python 中的谷歌云语音 api。我正在关注这个 link .我也提到了这个 stackoverflow link .但是我对设置环境变量感到震惊。我做过的事情: 1.安装gclou
speech-to-text - IBM Speech to Text 字母数字字符串识别？
在尝试让 Speech to Text(IBM 语音网关 IVR 应用程序)识别字母数字字符串时，我想知道我是否可以创建一个自定义语法或实体来限制 STT 仅识别单个字母和数字，不包括完全的话。例如，
speech - Web Speech API可以与Web Audio API一起使用吗？
是否可以将来自Web Speech API的合成语音用作Web Audio API音频上下文中的SourceNode？最佳答案实际上，我问过要在Web Speech邮件列表中添加此内容，并且基本上
speech-recognition - 语音到文本的大型音频文件 [Microsoft Speech API]
使用 Microsoft Speech API 转录中/大型音频文件(每个文件约 6-10 分钟)的最佳方法是什么？像批处理音频文件转录这样的东西？我使用了 https://docs.microso
speech-recognition - 408 请求超时 Microsoft Speech to Text
我的 .wav 文件长度只有 4 秒。即使在多次重试并在云端运行后，我仍然不断收到以下错误 * upload completely sent off: 12 out of 12 bytes
speech-recognition - 有人在生产中使用 Google Speech API 吗？
我找到了一些描述如何使用 Google 语音 API 的文章 ( http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/
google-cloud-speech - 需要帮助 Speech-to-text，重试次数过多总是失败
我使用 google 语音转文本 API 从音频中获取字幕，但是当音频太长时，通常超过 60 分钟，重试次数过多会失败。它说:google.api_core.exceptions.GoogleAPIC
c# - System.Speech.Recognition 是否使用 "speech training"？
我有一些来自 System.Speech.Recognition 的简单代码可以正常工作: using (var recognizer = new SpeechRecognitionEngine(ne
text-to-speech - Speech API OneCore 中的 Sayaka 语音在哪里？
Windows 10。我在“设置”中安装了日语 TTS 语音。现在，当我在 Speech API 5.4 OneCore 中使用语音枚举时(虽然不是在 5.4 中)，我得到 6 个语音: 大卫齐拉
google-text-to-speech - Google Cloud Text-to-Speech 请求的最大大小
当我提交对太长文本的综合请求时，我收到以下错误: google.api_core.exceptions.ResourceExhausted: 429 Received message larger t
C# 和 Microsoft Speech.Recognition 和 Speech.Synthesis
我是 C# 的新手，也是 Speech.Recognition 的新手。我搜索了很长时间的教程，但没有找到那么多，我什至不确定我是否正确包含了所有内容。我下载了: SDK Runtime Langu
html - 是否可以使 "HTML to speech"与 "Text to speech"相同？
我有一个奇怪的要求，即在我现有的应用程序中我有 Text2Speech 并且为此，我使用了 AVSpeechSynthesizer 来语音文本，但现在要求改变了，现在我需要将 HTML 文件数据转换为
speech-recognition - 谷歌语音 API : Can recognize speech from OGG file
我使用 Google Speech API 通过 Python 识别 .OGG 文件音频中的越南语语音。但它不会返回任何结果。最佳答案至少在英文版的Google Speech API中，需要使用F
speech-recognition - 如何使用 Codename One 中的 Google Speech API？
我想从手机录制音频，然后将其发送到谷歌语音非流媒体 API。我可以使用 Capture.captureAudio() 进行录音，但是我不知道音频编码和采样率是什么，因为它们是必需的 for the a
speech-to-text - 在 google-cloud-speech 中识别 .wav 音频文件的问题
我使用谷歌云语音到文本 API 将音频转换为文本。对于 .raw文件它工作正常但是对于 .wav文件它给了我类似的错误: Google::Gax::RetryError Exception: Ga
.net - System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间有什么区别？
.NET 中有两个类似的用于语音识别的命名空间和程序集。我试图了解其中的差异以及何时适合使用其中之一。程序集 System.Speech(在 System.Speech.dll 中)有 System
google-cloud-speech - Google Cloud Speech API 使用的端点/端口是什么
通过流式 API (Performing Streaming Speech Recognition on an Audio Stream) 使用 Google Cloud Speech API，我们

首页

博学

6Ren·AI

商城

speech-recognition - 谷歌语音 API