gpt4 book ai didi

google-speech-api - 谷歌语音 API 流

转载 作者:行者123 更新时间:2023-12-02 17:22:25 25 4
gpt4 key购买 nike

我正在尝试使用 syncrecognize 方法将我的 PBX IVR 连接到 Google Speech API,但由于我需要录制语音,将其发送到 API,等待响应并处理回来,这是不可能的进行正常对话或尝试进行正常对话/处理语音,将其用于实时服务。有没有推荐的其他API?或者有没有办法设置 VoIP/Streaming to Google。类似于 Alexa/Google Home。我没有找到 RecognitionAudio 的任何内容 对象:

最佳答案

Google Cloud Speech API 服务支持两种不同的功能:

  • 非流式识别,假设您向 Google 平台提供完整的音频并在处理后收到结果
  • Streaming Recognition ,允许您以交互方式(实时)提供音频,并在处理音频 block 时获得有关结果(部分、临时、结果和最终结果)的通知

以上两种操作都可以是:

  • Syncronous,执行命令,等待结果(适用于短文件标准识别)
  • 异步,发出命令并等待通知/检查特定命令结果(通常在不同线程或多线程环境中,音频超过一分钟的强制模式)

Streaming Recognition API 推荐用于您的应用场景,考虑到它只能通过 Cloud Speech RPC API (google RPC) 访问,而非 Streaming Recognition API 可用于 Cloud Speech REST 和 RPC API。

我们通过 gRPC API 在类似的应用程序环境中使用了 AsyncStreamingRecognize,该项目使用 C++,环境设置相当长且复杂(您需要为您的环境下载和构建 grpc、protoc 和 Google Speech API stub /库)。对于应用程序,我们使用了 Google Speech API Site 上提供的示例作为引用,一旦环境准备就绪,就可以非常简单地使示例应用程序逻辑适应我们的特定场景。

使用流式 API,您在音频编码(并非所有编码都受支持)和处理的音频长度(在流式中您最多可以处理 1 分钟的语音)方面有限制,此外,您只能通过必须启用才能使用语音 API 的服务帐户。

关于google-speech-api - 谷歌语音 API 流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41737943/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com