gpt4 book ai didi

flac - 谷歌云语音同步识别 "INVALID_ARGUMENT"

转载 作者:行者123 更新时间:2023-12-04 23:16:41 25 4
gpt4 key购买 nike

我管理了“概述教程”:https://cloud.google.com/speech/docs/getting-started
然后我尝试使用我自己的音频文件。我上传了一个采样率为 16000Hz 的 .flac 文件。

我只改了sync-request.json下面的文件与我自己的音频文件托管在谷歌云存储 (gs://my-bucket/test4.flac)

{
"config": {
"encoding":"flac",
"sample_rate": 16000
},
"audio": {
"uri":"gs://my-bucket/test4.flac"
}
}

该文件被很好地识别,但请求返回“INVALID_ARGUMENT”错误
{
"error": {
"code": 400,
"message": "Unable to recognize speech, code=-73541, possible error in recognition config. Please correct the config and retry the request.",
"status": "INVALID_ARGUMENT"
}
}

最佳答案

根据 this回答,所有编码 仅支持 1 个 channel (单声道)声音的

我正在使用以下命令创建 FLAC 文件:

ffmpeg -i test.mp3 test.flac

Sample rate in request does not match FLAC header



但是添加 -ac 1 (将音频 channel 数设置为 1)修复了此问题。
ffmpeg -i test.mp3 -ac 1 test.flac

这是我的全部 Node.js代码
const Speech = require('@google-cloud/speech');
const projectId = 'EnterProjectIdGeneratedByGoogle';

const speechClient = Speech({
projectId: projectId
});

// The name of the audio file to transcribe
var fileName = '/home/user/Documents/test/test.flac';


// The audio file's encoding and sample rate
const options = {
encoding: 'FLAC',
sampleRate: 44100
};

// Detects speech in the audio file
speechClient.recognize(fileName, options)
.then((results) => {
const transcription = results[0];
console.log(`Transcription: ${transcription}`);
}, function(err) {
console.log(err);
});

采样率可以是 16000 或 44100 或其他有效的,编码可以是 FLAC 或 LINEAR16。 Cloud Speech Docs

关于flac - 谷歌云语音同步识别 "INVALID_ARGUMENT",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39620198/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com