gpt4 book ai didi

google-cloud-platform - Google Speech API 单句

转载 作者:行者123 更新时间:2023-12-03 17:03:46 25 4
gpt4 key购买 nike

Google Speech API 的如何使用 SingleUtterance工作?根据文档,这是谷歌确定说话者何时说出单个话语的方式。我明白它的作用,但我想知道如何? API 是否只是等待一段时间的“无语”音频?如果是这样,多久一段无声的音频会触发一段话语的结束吗?

它是否有其他类型的 AI 算法可以帮助确定某人何时停止说话?

谢谢

最佳答案

我不认为细节会暴露,在我看来,音频结尾的检测是 API 的决定。相反,它提供了识别何时做出此类决定的方法。

在正常情况下,流将继续收听和处理音频,直到 the stream is closed directly, or the stream's limit length has been exceeded .在这种情况下,single_utterance 不需要设置。

当您需要它(例如语音命令)并设置 single_utterance=true 时,API 将决定何时完成识别并向您的客户端发送 END_OF_SINGLE_UTTERANCE event并停止承认。

关于google-cloud-platform - Google Speech API 单句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52292346/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com