audio - 如何使用 FFmpeg 获得音频峰值？-6ren

audio - 如何使用 FFmpeg 获得音频峰值？

转载作者：行者123 更新时间：2023-12-02 23:01:48

26

4

我正在开发一款音乐应用，需要为我的文件生成音频频谱。就像这个:

所以我尝试使用 audiowaveform像这样:

audiowaveform -i music.mp3 --pixels-per-second 1 -o out.dat

这给了我以下结果[正确结果]:[前 10 个词是元数据]

0000000 0001 0000 0000 0000 bb80 0000 bb80 0000
0000020 00f9 0000 df3e 1fa2 e22c 1ef3 e0bb 1e5a
0000040 e099 1e88 dfcf 1c33 e29f 1d4c e055 1f80
0000060 df63 1e3a e1b4 1f31 e271 1d81 e0e5 1b1c
0000100 e06d 1be4 dee2 1cb0 e118 1da1 e026 1dea
0000120 e055 1dac df9b 1dbf e0c3 2063 ded4 21b2
0000140 dec9 1f8d de5b 20c8 e02d 216a dd7e 21af
0000160 dea1 20ac de6c 2170 de80 1e12 de6f 1fb9
0000200 dde3 2106 e0d9 21be de88 218c de81 1f9f
0000220 decb 20ff deb2 1edc df32 20c4 dde7 ...

但是当我用 FFmpeg 做这种工作时:

ffmpeg -y -i music.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 1 -v quiet out.pcm

这给出了以下结果，完全不同:

0000000 0001 fffe fffe fffe 0000 ffff fffd 0000
0000020 ffff ffff fffe 0001 0001 fffd 0001 fffe
0000040 0002 fffe fffc 0002 ffff fffc fffe 000b
0000060 0007 fffb 0004 0001 ffff fffd ffff 0002
0000100 0008 0006 fffe ffff 0001 0000 0003 000a
0000120 fffd ffff 0004 ffff 0001 ffff fffd ffff
0000140 fffe ffff 0001 fffd fffe 0000 fffb 0002
0000160 0002 0000 fffe 0000 fffb fffe fffe 0000
0000200 ffff 0000 ffff fffc 0002 0003 0005 0003
0000220 0002 fffb fffb fffa fffa 0004 0009 ...

您可能想知道为什么我要执行 -ar 1 或 --pixels-per-second 1？这是因为我要为每一秒画一条线，所以我需要每一秒都得到峰值。 .我不知道我在那里错过了什么，但我希望从 FFmpeg 得到相同的结果。

最佳答案

这不是 FFMPEG 的解决方案，但仍会产生波形阵列。

我的解决方案是使用 audiowaveform linux 软件包，它有一个简单的 cli，可以以所需的采样率提取波形数据。

你可以像这样在 ubuntu 上安装它:

sudo add-apt-repository ppa:chris-needham/ppa
sudo apt-get update
sudo apt-get install audiowaveform

或在 macOS 上使用 homebrew喜欢:

brew tap bbc/audiowaveform
brew install audiowaveform

首先，我使用问题中提供的命令绘制波形，但它不准确且脏。因为它每秒取一个样本，这不是我想要的。所以我决定每秒取 100 个样本，然后用一些 JS 代码得到平均值。所以提取波形的命令将是:

audiowaveform -i /root/audio.mp3 --pixels-per-second 100 --output-format json -

这将在标准输出上输出音频波形数据和一些元数据(末尾的连字符起到了作用)。所以在我的例子中，我使用 NodeJs 来获得这个输出并将波形数组减少到波形 block 的平均值。 请注意，我从波形中删除了负数以处理波形的上半部分。

import {exec} from "child_process";

export default function getAudioWaveform(filename, blockSize = 100) {
    return new Promise((resolve, reject) => {
        const command = `audiowaveform -i ${filename} --pixels-per-second ${blockSize} --output-format json -`;

        exec(command, (error, stdout, stderr) => {
            if (error) reject(error, stderr);

            try {
                const data = JSON.parse(stdout).data.filter((_, i) => i % 2 === 1)

                const waveform = [];
                for (let i = 0; i < data.length; i++)
                    waveform[i] = Math.round(data.slice(i * 100, (i + 1) * 100).reduce((s, n) => s + n, 0) / 100);

                resolve(waveform);
            } catch (ex) {
                reject(ex);
            }
        });
    })
}

关于audio - 如何使用 FFmpeg 获得音频峰值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62242044/

26

4

0

文章推荐： c# - 如何在NEST中进行 Assets 汇总和/或组合？

文章推荐： javascript - JS 如何计算表达式 ({...}).objMethod()？

文章推荐： javascript - Node 中的MongoDB聚合函数超时/不返回值

文章推荐： windows - 使用 Powershell 阻止文件

audio -
我有一个小型WordPress网站。我做了很多音频工作，并且试图在WordPress的博客条目中发布HTML5音频剪辑。由于某种原因，它不起作用。它可能与我在WordPress网站上使用的样式有关，但
html5-audio - Web Audio API 和
我在让 html5 标签与 Web Audio API .createMediaElementSource() 方法配合使用时遇到问题。请参阅下面的 jsFiddle/代码。任何想法这里出了什么问题将
audio - 如何在 OS X 上将 audio.m4a 转换为 audio.amr？
我尝试安装ffmpeg $ brew install ffmpeg 并运行 ffmpeg $ ffmpeg -i audio.m4a -ar 8000 -ab 12.2k audio.amr 我收到以
audio - Web Audio API中的FFT数据对应什么？
我已使用Web Audio API中的getByteFrequencyData方法使用了来自Analyzer节点的FFT数据来创建频谱可视化器，如下所示: 在这种情况下，我有256个数据箱。这个数字到
audio - 无法为Wwise安装GVR Audio SDK
Google VR刚刚为wwise制作了一个VR插件: https://developers.google.com/vr/audio/wwise-getting-started https://git
audio - 如何使用Web Audio API在特定位置将音频记录添加到现有音频记录中？
如何将新记录追加到现有记录中的选定位置或特定位置？例如，有一个5秒的录制，我想再次录制，但是将此录制追加到先前录制的特定位置，说出来:在3秒钟的录制长度之后追加此录制。最佳答案您可以使用getC
audio - omxplayer : audio out of sync
我们基于 Raspberry Pi 和 omxplayer 构建简单的网络控制视频播放器。我们遇到的问题是任何使用 ffmpeg 转码的文件都有音频不同步。在 iPad 上制作并直接上传到 Pi 的视
audio - Web Audio API如何影响游戏开发？
我正在尝试了解Web Audio API的引入对基于Web的游戏的开发意味着什么。 Flash游戏当然可以执行一些相当高级的音频处理，对于简单的游戏，音频元素也许就足够了。但是Web Audio AP
audio - 如何在Simple Audio Engine中循环播放声音效果
我已经在如何用简单的音频引擎循环播放声音效果方面进行了广泛的搜索，但是在cocos2d论坛上除了hello with looping sfx之外，它并没有取得太大进展，因为它存在多个问题。如何在Sim
c++ - Decoding an MKA audio file into raw data(MKA Audio to raw audio data)
我的任务是打开一个扩展名为 mka 的现有音频文件(Matroska 容器)并提取原始音频数据。 This示例仅显示了从 mp2 文件中提取原始数据的示例。我不知道如何使用 mka 容器执行此操作。我
audio - Lync 2013 SDK-当 “Join meeting audio from”设置设置为 “Do not join audio”时，加入 session 并连接AVModality
我是Lync 2013 SDK的新手(现在已经使用了几周)，并且能够弄清除此以外的大部分东西…… 当我加入 session 时(使用ConversationManager.JoinConference
audio - 操作方法 : The Most Simple Audio Engine?
我好奇。如何实现有史以来最简单的音频引擎？我有一些类似使用默认音频设备的音频数据流的想法。玩了很多 RtAudio，我认为如果可以放弃一些功能，这是可能的。有人知道从哪里开始吗？最佳答案我会这样做
audio - 调整频率范围-Web Audio API分析器
我一直在玩网络音频API。我正在使用getByteFrequencyData来显示频带的分贝数据，但是我想更改显示频带的整个范围，因为现在重要的音频都被压缩为一对频带。有关如何执行此操作的任何想法
audio - 使用NAudio接收状态更改的 Audio Session 回调
我想在音频 session 以NAudio开始和结束时接收回调。以下代码正在运行: private void SetupMediaSessionCallbacks() {
audio - Web Audio Api Record音频节点
我可以用trackPosition，offset以某种方式记录并输出到WAV。当在浏览器中播放时，它工作正常，我只想输出到WAV文件。 for (var i = 0; i 0) {
audio - Google Resonance Audio SDK的露天使用
在哪种情况下，我们可以不将Google Resonance Audio SDK与耳机配合使用，而应将其与真实的扬声器配合使用(例如，安装在360°的音圈设置中)？还是所有算法都不适用于真实的扬声器输
audio - Web Audio API-如何使用AudioPannerNode进行常规LR平移
AudioPannerNode是一个处理节点，用于在三维空间中定位/空间化传入的音频流。有没有一种方法可以将其用于常规LR平移，请记住它使用3D笛卡尔坐标系与侦听器结合使用，该侦听器的位置和方向与平移
audio - 如果.ogg文件在列表中的第一位，Safari将不会播放
我有一个带有两个源的音频对象，分别为M4A和OGG格式。代码如下: 然后，我可以调用document.getElementById('audio1')。play()并开始播放。它适用于所有
audio - Web Audio API 注意事项
我正在尝试构建一个允许将时间/节奏(可能是音高)输入到 Web 音频振荡器节点的界面。实际上创建了一个“步进音序器”。为 Web Audio API 振荡器节点触发预定 NoteOn 的最佳方式是什
core-audio - Core Audio 中的亚毫秒级延迟
是否可以使用 Core Audio 以亚毫秒级延迟播放声音？我尝试过使用具有不同大小和缓冲区数量的 AudioQueues，也尝试过使用 AudioUnits，但我一直无法将延迟降低到 30 毫秒以

首页

博学

6Ren·AI

商城

audio - 如何使用 FFmpeg 获得音频峰值？