python - 如何将标题信息添加到 wav 文件以获得与 ffmpeg 相同的结果？-6ren

python - 如何将标题信息添加到 wav 文件以获得与 ffmpeg 相同的结果？

转载作者：行者123 更新时间：2023-12-04 23:01:35

25

4

我正在尝试使用 Fastspeech 生成一个 .wav 文件。当我将数据保存为 .pcm 文件，并通过 ffmpeg 将其传输到 .wav 时，效果很好。但是当我只是添加一个 wav 头信息并将其保存到 .wav 时，听起来很嘈杂，我的代码有什么问题？
pcm的代码:

    wav = wav.astype(np.float32)
    wav = wav.tostring()
    with open('test.pcm', 'wb') as f:
        f.write(wav)

ffmpeg 命令:

ffmpeg -f f32le -ar 16000 -i test.pcm file.wav  # works well

直接写wav:

import struct

def pcm2wav(sample_rate, pcm_voice):
    if pcm_voice.startswith("RIFF".encode()):
        return pcm_voice
    else:
        sampleNum = len(pcm_voice)
        rHeaderInfo = "RIFF".encode()
        rHeaderInfo += struct.pack('i', sampleNum + 44)
        rHeaderInfo += 'WAVEfmt '.encode()
        rHeaderInfo += struct.pack('i', 16)
        rHeaderInfo += struct.pack('h', 1)
        rHeaderInfo += struct.pack('h', 1)
        rHeaderInfo += struct.pack('i', sample_rate)
        rHeaderInfo += struct.pack('i', sample_rate * int(32 / 8))
        rHeaderInfo += struct.pack("h", int(32 / 8))
        rHeaderInfo += struct.pack("h", 32)
        rHeaderInfo += "data".encode()
        rHeaderInfo += struct.pack('i', sampleNum)
        rHeaderInfo += pcm_voice
        return rHeaderInfo

# .......
# get data with FastSpeech model
wav = wav.astype(np.float32)
wav = wav.tostring()
wav = pcm2wav(16000, wav)
with open('test.wav', 'wb') as f:
    f.write(wav)   # many noisy sounds

最佳答案

我问了这个问题并最终解决了。我替换了第一个struct.pack('h', 1)至struct.pack('h', 3)它有效。
我找到了scipy.io.wavfile.write可以生成好的wav文件。然后我在这个函数的源码中得到了答案。

if dkind == 'f':
    format_tag = WAVE_FORMAT_IEEE_FLOAT  # WAVE_FORMAT_IEEE_FLOAT=3
else:
    format_tag = WAVE_FORMAT_PCM  # WAVE_FORMAT_PCM=1
# ...
fmt_chunk_data = struct.pack('<HHIIHH', format_tag, channels, fs,
                                 bytes_per_second, block_align, bit_depth)

我的数据是 float32 类型，所以它的 format_tag 应该是 3，而不是 1。

关于python - 如何将标题信息添加到 wav 文件以获得与 ffmpeg 相同的结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67317366/

25

4

0

文章推荐： Python使用存储在变量中的将stdout和stderr发送到多个文件

文章推荐： macos - 为 Mac OSX High Sierra 10.13 编译 ffmpeg

文章推荐： macos - 无法使用 Homebrew 软件安装 FFMPEG

文章推荐： c++ - FFMPEG实现RTSP客户端，高速播放

ffmpeg - ffmpeg 无法识别记录在案的 ffmpeg 命令
我正在尝试使用 ldash 等选项和 http_opts ，正如 dash muxer 文档所描述的，但 FFmpeg 无法识别它们。我正在使用最新发布的 ffmpeg v4.2.2 版本。我在 ff
ffmpeg - 是否有某种 ffmpeg 输出转换为 ffmpeg 命令行？
假设我们有许多想要与 -vcodec 副本(或等效语法)合并的视频记录。无需重新编码，不会损失质量。并且很少有记录(minor set)，有另外的编解码器，参数等等。所以我们可以使用 ffprobe
ffmpeg - 安装错误: No such file or directory: 'ffmpeg' : 'ffmpeg'
有没有办法安装 ffmpeg 没有root访问权限？使用 ./configure 无法做到这一点来自 git 克隆 git://source.FFmpeg.org/fFFmpeg.git 最佳答案是
ffmpeg - 直接使用 FFmpeg 与使用 Ffmpeg 命令行的应用程序有什么区别？
在应用程序中直接使用 FFmpeg 与使用 Ffmpeg 命令行有什么区别？最佳答案没有:FFmpeg 命令行只是一个使用 FFmpeg API 的应用程序。当然，在使用该应用程序时，您仅限于已实
ffmpeg - 有没有办法使用各种 ffmpeg 命令找出 ffmpeg 在我的系统中的性能是否最佳？
我正在使用以下命令对文件(下面的媒体信息)进行编码: ffmpeg -i AHomeMovie.mkv -map 0 -c copy -c:v libx264 -preset veryslow -cr
ffmpeg - 为 ffmpeg 视频添加边框 [ffmpeg-python]
我正在制作一张圣诞贺卡，我需要将视频嵌入到右侧(边框内)的卡片中，并在左侧显示一些文本。为简单起见，假设我有一个带有透明孔的盒子。我想在那个洞里显示视频。我正在使用 ffmpeg-python很高
Laravel FFmpeg 错误调用未定义的方法 FFMpeg\FFMpeg::fromDisk()
我正在使用 laravel ffmpeg 为视频创建缩略图，但是当我运行代码时，它返回给我 Call to undefined method FFMpeg\FFMpeg::fromDisk() 我不知
ffmpeg - ffmpeg 的硬件加速不起作用
我为我的 nvidia 下载了 cuda 驱动程序但它仍然不使用我的 GPU，它仍然使用 cpu。我怎样才能让它使用GPU。我也听说过硬件加速，但那不起作用。它必须是 h.264 最佳答案你
ffmpeg - 剪切多个部分后音频和视频不同步 - FFMPEG
尝试剪切视频的多个部分时，我遵循此问题的解决方案 Cut multiple parts of a video with ffmpeg .但问题是，如果我剪切多次(比如大约 20 次或更多)，视频和音频
ffmpeg - FFMPEG 的免许可编解码器有哪些？
所以我最近开始在我打算在商业上分发的应用程序中实现 ffmpeg。而且我很难理解整个许可过程。我见过的最常回答的问题似乎是关于 x264，它需要 x264.org 的付费许可才能在商业上使用它(对吗
ffmpeg - ffmpeg 代码中是否存在缩短视频时间的因素？
我使用 ffmpeg 更改视频文件的分辨率，转换到另一个位置后，视频持续 0 秒，但最初持续 2 分钟我的ffmepg代码: ffmpeg -i input.mp4 -filter:v scale=
ffmpeg - FFMPEG 不支持加载外部过滤器是否有特定原因？
如上: FFMPEG 不支持在没有第三部分库的情况下加载外部过滤器是否有特定原因？ (像弗莱0r) 我必须重新编译整个包来添加一个新的过滤器! 最佳答案只有开发人员可以肯定地回答，但我会冒安全风险和
ffmpeg - 使用新的编码器编译 FFmpeg
我收到了一个编码器，我需要用 FFMPEG 编译，我是新手，所以我不知道如何用 ffmpeg 添加/编译它。编码器是JSV，我的服务器是ubuntu 14.04。我已经开始阅读这篇 https://
ffmpeg - FFMPEG 的硬件要求
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题，使其成为
ffmpeg - 如何确定某些编解码器和格式之间的转码和重新混合是否可以用于特定版本的 ffmpeg？
我正在制作一个利用 ffmpeg 重新混合和转码视频文件的程序。我想使用 ffmpeg -codecs和 ffmpeg -formats (或通过 ffmpeg 可用的任何其他命令)来检查我可以在哪些
ffmpeg - 移动文本drawtext过滤器的速度 - FFMPEG
这个问题在这里已经有了答案: ffmpeg moving text drawtext (1 个回答) 3年前关闭。我正在使用此命令使用 ffmpeg 将文本从一个地方移动到另一个地方 ffmpeg
ffmpeg - ffmpeg/ffprobe中的持续时间比特率和流比特率有什么区别？
为什么 ffmpeg/ffprobe 为流和整个文件提供不同的比特率值？当我使用 ffprobe 分析 mp3 文件时，它会在第一行和第二行给出不同的比特率。有谁知道，有什么区别？ // File
ffmpeg - FFmpeg 中的多色文本
如何在ffmpeg中使用drawtext在视频上绘制多色文本？示例:我想突出句子中的专有名词， “XYZ公司股价上涨91%” 高亮 XYZ 白色黄色用绿色突出显示 91% 如果您有任何其他方法不
ffmpeg - 如何为您的不和谐机器人安装 FFMPEG？
我想让我的不和谐机器人播放音乐，但我不断收到“找不到 FFMPEG”错误。我的机器人主要是由 ping 制成的，所以我不会上传那部分。音乐代码应该是这个。 const Discord = requi
ffmpeg - ffmpeg drawtext过滤器中的德语变音符号
我需要帮助在 ffmpeg drawtext 过滤器中正确/(完全)显示德语变音符号“äüö”。我现在不能说我的无能是由于缺乏 ffmpeg 专业知识或机器配置，还是两者兼而有之。非常感谢您的意见。

首页

博学

6Ren·AI

商城

python - 如何将标题信息添加到 wav 文件以获得与 ffmpeg 相同的结果？