gpt4 book ai didi

google-cloud-platform - 如何在 Google Cloud Speech-to-Text API 中禁用句子级自动更正

转载 作者:行者123 更新时间:2023-12-01 23:02:51 25 4
gpt4 key购买 nike

我正在从事一项语音识别任务,其中涉及检测 child 的言语能力,随着时间的推移而提高...

我想使用 Google Cloud Speech to Text API 进行 ASR 检测部分。然后我会使用不同测量的记录来估计进展。

但是! Google Speech API 的句子级自动更正始终重写口语句子的前一部分...

有办法禁用此 ASR 的自动更正功能吗?

我无法使用“speechContext”、“single_utterance”或“maxAlternatives”选项绕过此问题。

“single_utterance”可能适用于单词,但它可以纠正拼写错误..

在这个领域有什么建议吗?

最佳答案

如果您使用流式传输而不是批量识别,则在转录该部分音频后,您应该立即收到答案,而不会等待句子的其余部分。然后,您应该只存储流提供的第一个答案,而不是进一步的更正。

这意味着您不必必须等到isFinal=True

有关我的意思的快速而简单的示例,请转到 speech API page ,并在打开开发者工具的情况下运行流测试。在那里,您将看到在说出单词时收到的流数据:

stream exemple

关于google-cloud-platform - 如何在 Google Cloud Speech-to-Text API 中禁用句子级自动更正,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48932010/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com