gpt4 book ai didi

python - 采样音频不保留波(矢量)!

转载 作者:太空狗 更新时间:2023-10-29 21:59:07 27 4
gpt4 key购买 nike

我做了一个Telegram robot ,它的工作之一是从音频文件创建样本。现在对于发送给它的大多数音频,样本都非常好;像这样:

enter image description here

但是,对于一些音频,样本看起来有点奇怪:

enter image description here

如您所见,此文件中的波形未显示! (我可以向你保证,声音不是空的)

为了创建示例,我使用 pydub(谢谢,James!)。这是我创建示例的部分:

song = AudioSegment.from_mp3('song.mp3')
sliced = song[start*1000:end*1000]
sliced.export('song.ogg', format='ogg', parameters=["-acodec", "libopus"])

然后我使用 bot.send_voice 方法发送样本。 Like this :

bot.send_voice(
chat_id=update.message.chat.id,
voice=open('song.ogg', 'rb'),
caption=settings.caption,
parse_mode=ParseMode.MARKDOWN,
timeout=1000
)

Telegram Bot API 的文档说:

Use this method to send audio files, if you want Telegram clients to display the file as a playable voice message. For this to work, your audio must be in an .ogg file encoded with OPUS (other formats may be sent as Audio or Document).

这就是为什么在这行代码中:

sliced.export('song.ogg', format='ogg', parameters=["-acodec", "libopus"])

我使用了 parameters=["-acodec", "libopus"]

谁能告诉我我做错了什么?提前致谢!

最佳答案

暗中猜测:

刚刚试听了这两首 Muse 歌曲,“Pressure”是一首比“The Void”响亮得多的摇滚歌曲。我怀疑 Telegram 服务本身只是在执行语音到文本翻译时将音乐检测为噪音。与言语之间的动态范围很宽的语音不同,音乐的音量往往相同。因此,每个样本的相对体积相对相同 - 因此是一条平线。

关于python - 采样音频不保留波(矢量)!,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55363144/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com