gpt4 book ai didi

google-api - Google Speech Recognition API 结果为空

转载 作者:行者123 更新时间:2023-12-03 22:22:58 26 4
gpt4 key购买 nike

我正在向 Google Cloud Speech API 执行异步请求,但我不知道如何获取操作结果:

请求 POST: https://speech.googleapis.com/v1beta1/speech:asyncrecognize

正文:

{
"config":{
"languageCode" : "pt-BR",
"encoding" : "LINEAR16",
"sampleRate" : 16000
},
"audio":{
"uri":"gs://bucket/audio.flac"
}
}

返回:
{ "name": "469432517" }
所以,我发了一个帖子: https://speech.googleapis.com/v1beta1/operations/469432517

返回:
{
"name": "469432517",
"metadata": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeMetadata",
"progressPercent": 100,
"startTime": "2016-08-11T21:18:29.985053Z",
"lastUpdateTime": "2016-08-11T21:18:31.888412Z"
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.cloud.speech.v1beta1.AsyncRecognizeResponse"
}
}

我需要得到操作的结果:转录的文本。

我怎样才能做到这一点?

最佳答案

你已经得到了操作的结果,它是空的。结果为空的原因是格式不匹配。您应该已经提交了“LINEAR16”文件(PCM 未压缩数据,基本上是 WAV 文件)并尝试提交 FLAC(压缩格式)。

空结果的其他原因可能是不正确的采样率、不正确的 channel 数等。

最后,纯静音的文件将导致空响应。

关于google-api - Google Speech Recognition API 结果为空,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38906527/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com