gpt4 book ai didi

ffmpeg - WAV 文件上的 Google Speech to Text 提供

转载 作者:行者123 更新时间:2023-12-04 22:58:17 25 4
gpt4 key购买 nike

我正在使用 Google Speech to Text API 将 WAV 文件转换为文本。当我播放 WAV 文件时,它工作正常,但是当我运行 Google Speech To Text API 时,我收到此错误:

WAV header indicates an unsupported format.
当我尝试使用 ffmpeg 分析文件时工具,它得到以下错误:
Output #0, wav, to '/home/shubham/workspace/intent-service/scripts/audio2.tmp.wav':
Metadata:
ISFT : Lavf57.83.100
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, mono, s16, 128 kb/s
Metadata:
encoder : Lavc57.107.100 pcm_s16le
[gsm_ms @ 0x55d4c255cd20] Packet is too small
Error while decoding stream #0:0: Invalid data found when processing input size=7924kB time=00:08:27.16 bitrate= 128.0kbits/s speed=3.72e+03x
video:0kB audio:7924kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000961%
我错过了什么?

最佳答案

问题是文件编码不是支持的类型之一。我们使用了ffmpeg将编码更改为 mu-law 现在可以正常工作了。

关于ffmpeg - WAV 文件上的 Google Speech to Text 提供,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63091027/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com