gpt4 book ai didi

streaming - Google Speech to Text 延迟 25 秒

转载 作者:行者123 更新时间:2023-12-04 01:31:44 25 4
gpt4 key购买 nike

这是我在使用 Google Speech to Text Engine 时遇到的问题。我目前正在 32kB block 中实时流式传输 16 位/16 kHz 音频。但是在发送音频和接收转录之间平均有 25 秒的延迟,这违背了实时转录的目的。

为什么会有这么高的延迟?

最佳答案

Google 语音转文本 documentation建议使用 100 毫秒的帧大小以最大程度地减少延迟。

32kB *(8 位/1 字节)*(1 个样本/16 位)*(1 秒/16000 个样本)= 1 秒。

因此请尝试发送 3.2kB 的 block 。这将平均延迟从 25 秒降至约 4 秒。

关于streaming - Google Speech to Text 延迟 25 秒,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51545598/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com