gpt4 book ai didi

python - 如何使用 FFmpeg 将音频转换为 WAVE_FORMAT_PCM?

转载 作者:行者123 更新时间:2023-12-03 00:13:19 30 4
gpt4 key购买 nike

我正在使用 Python 的 wave 模块来读取音频,并使用 FFmpeg 将音频从其他类型转换为 wav。但是,我遇到了一些问题。

我写了v.py来生成静音音频文件a.wav

import sys, wave, math
import numpy as np

wave_data = np.zeros(44100).astype(np.short)

f = wave.open('a.wav', 'wb')
f.setnchannels(1)
f.setsampwidth(2)
f.setframerate(96000)
f.writeframes(wave_data.tostring())
f.close()

然后我使用FFmpeg将 a.wav“复制”到 b.wav(虽然它似乎对文件进行编码/解码),但我只能用Python读取 a.wavb.wav 打不开。
[user@localhost tmp]$ ffmpeg -i a.wav b.wav
Guessed Channel Layout for Input Stream #0.0 : mono
Input #0, wav, from 'a.wav':
Duration: 00:00:00.46, bitrate: 1536 kb/s
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 96000 Hz, mono, s16, 1536 kb/s
Stream mapping:
Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
Output #0, wav, to 'b.wav':
Metadata:
ISFT : Lavf57.71.100
Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 96000 Hz, mono, s16, 1536 kb/s
Metadata:
encoder : Lavc57.89.100 pcm_s16le
size= 86kB time=00:00:00.45 bitrate=1537.8kbits/s speed= 706x
video:0kB audio:86kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.115646%
[user@localhost tmp]$ python3
Python 3.6.4 (default, Jan 23 2018, 22:25:37)
[GCC 7.2.1 20170915 (Red Hat 7.2.1-2)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import wave
>>> wave.open('a.wav')
<wave.Wave_read object at 0x7efea1c5e550>
>>> wave.open('b.wav')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/lib64/python3.6/wave.py", line 499, in open
return Wave_read(f)
File "/usr/lib64/python3.6/wave.py", line 163, in __init__
self.initfp(f)
File "/usr/lib64/python3.6/wave.py", line 143, in initfp
self._read_fmt_chunk(chunk)
File "/usr/lib64/python3.6/wave.py", line 260, in _read_fmt_chunk
raise Error('unknown format: %r' % (wFormatTag,))
wave.Error: unknown format: 65534
>>>

我应该如何更改 FFmpeg 的命令以将文件转换为 WAVE_FORMAT_PCM,以便我可以使用 Python 读取 b.wav

最佳答案

issue是 Python 的 wave 模块不支持导入采样率大于 48 kHz 的文件。 MP3 中介路由有效,因为在这种情况下,ffmpeg 会自动将输入下采样到 48 kHz。据报道,scipy 可以导入 48+ kHz 的文件。

使用 ffmpeg 手动下采样到 48 kHz 的语法是

ffmpeg -i in -ar 48000 out.wav

附言要跳过解码/编码,请使用 ffmpeg -i in.wav -c copy out.wav .

关于python - 如何使用 FFmpeg 将音频转换为 WAVE_FORMAT_PCM?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48740160/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com