gpt4 book ai didi

speech-recognition - INVALID_ARGUMENT : Request payload size exceeds the limit: 10485760 bytes

转载 作者:行者123 更新时间:2023-12-04 07:54:48 27 4
gpt4 key购买 nike

我第一次在项目中使用 GCS Speech API 将一系列音频文件转换为文本。每个文件大约有 60 分钟,并且是一个人在整个过程中不断地说话。
我已经安装了 GC SDK,我正在使用它来执行如下所示的请求:

gcloud ml speech recognize-long-running \
"/path/to/file/audio.flac" \
--language-code="pt-PT" --async

每次我在我的录音之一上运行它时,它都会给出以下错误消息:
ERROR: (gcloud.ml.speech.recognize-long-running) INVALID_ARGUMENT: 
Request payload size exceeds the limit: 10485760 bytes.

这似乎是一个非常严格的限制,因为如果 API 能够处理长达 180 分钟的文件,它就不可能输出最大值 10,000。值得说话的人物。
我试图将音频文件分成更小的部分,并达到四个 15 分钟的样本,即使如此我也遇到了同样的错误。此外,即使它有效,从现在开始分割我制作的每一个新录音也是一项非常乏味和不切实际的任务。

我一直在寻找,到目前为止,我还没有就如何增加或规避此限制得出任何结论。我使用的是免费试用帐户,但我很高兴升级到付费订阅以增加此限制。据我所知,即使我是付费订阅,这个限制也会持续存在。

有没有人找到解决这个问题的方法?

最佳答案

在与 Google Cloud 支持人员交谈后,我得出的结论是,这是由于我的免费试用订阅和文件大小(约 60 分钟)的限制所致。

升级到付费订阅并将我的文件上传到 Google Cloud Storage 后,我能够从转录中接收有效负载。

$ gcloud ml speech recognize-long-running "gs://test-bucket/my_audio_file.flac" --language-code="pt-PT" --async
Check operation [7456984365978465938] for status.
{
"name": "7456984365978465938"
}

$ gcloud ml speech operations describe 7456984365978465938
{
... payload ...
}

关于speech-recognition - INVALID_ARGUMENT : Request payload size exceeds the limit: 10485760 bytes,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51601697/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com