gpt4 book ai didi

python-3.x - python : How to use speech_recognition or other modules to convert base64 audio string to text?

转载 作者:行者123 更新时间:2023-12-03 01:15:26 30 4
gpt4 key购买 nike

我有像 data:audio/mpeg;base64,//OAxAAAAANIAAAAABhqZ3f4StN3gOAaB4NAUBYZLv...... 这样的 base64 音频字符串,我试图在 Python 中使用 base64 模块将 base64 转换为 wav 文件:

    decode_bytes = base64.b64decode(encoding_str)
with open(file_name + '.wav', "wb") as wav_file:
wav_file.write(decode_bytes)
然后我尝试使用 speech_recognition 模块将音频转换为文本,它给出了以下错误:
ValueError: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format
这个问题有解决方案吗?

最佳答案

好像您的音频文件是 mime 类型的 mp3 - audio/mpeg .您需要将其保存为 mp3

decode_bytes = base64.b64decode(encoding_str)
with open(file_name + '.mp3', "wb") as wav_file:
wav_file.write(decode_bytes)
并使用 pydub 将 mp3 转换为 wav 格式或 FFmpeg,然后将此 wav 文件提供给 Speech_recognition 模块。

关于python-3.x - python : How to use speech_recognition or other modules to convert base64 audio string to text?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62587308/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com