gpt4 book ai didi

audio - .wav 样本的解释

转载 作者:行者123 更新时间:2023-12-02 03:05:29 28 4
gpt4 key购买 nike

我正在尝试解释 .wav 文件以分析音频文件的不同方面,但我似乎无法正确获取数据采样部分。
我有一个音频文件(我在钢琴上拿着中间的 c)如下(用十六进制写成待剖析)

52 49 46 46 A4 64 17 00 57 41 56 45 66 6D 74 20  
10 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00
04 00 10 00 64 61 74 61 80 64 17 00 20 00 14 00
A2 FF 31 00 D2 FF 34 00 9C FF 28 00 0A 00 34 00

据此,我将其解释为:

ChunkID = 52 49 46 46 (RIFF)
ChunkSize = A4 64 17 00 (little endian = 1,533,092 bytes)
Format = 57 41 56 45 (WAVE)
Subchunk1ID = 66 6D 74 20 (fmt )
Subchunk1Size = 10 00 00 00 (little endian = 16 bytes)
AudioFormat = 01 00 (little endian = 1 --> PCM)
NumChannels = 02 00 (little endian = 2)
SampleRate = 44 AC 00 00 (little endian = 44,100 Hz)
ByteRate = 10 B1 02 00 (little endian = 176,400)
BlockAlign = 04 00 (little endian = 4 bytes/sample)
BitsPerSample = 10 00 (little endian = 16 bits)
Subchunk2ID = 64 61 74 61 (data)
Subchunk2Size = 80 64 17 00 (little endian = 1,533,056)

所有样本都是小端分割成左声道(2字节)和右声道(2字节)

Sample1 = 20 00 14 00 = (32, 20)
Sample2 = A2 FF 31 00 = (-94, 49)
Sample3 = D2 FF 34 00 = (-46, 52)
Sample4 = 9C FF 28 00 = (-100, 40)
Sample5 = 0A 00 34 00 = (10, 52)

我的问题专门针对示例解释。我认为我这样做是正确的,但是当我绘制大量 channel 1 的数据时,我最终得到了下图。

(此图仅为前750个样本) enter image description here

在 audacity 中打开同一个 .wav 文件时,我得到以下图像。

enter image description here

audacity 如何将我收集的数据转换成它显示的图像而不是我绘制的图像?我已经查看并尝试对此进行解释,但是我找不到很多关于音频文件的逐位解释的信息。任何可以为我指明正确方向的帮助或文章都将不胜感激!

最佳答案

我想通了,我在文件中绘制的图表还不够深入。最初的一点点只是无意义的空白噪音。一旦我绘制了前 750 个样本,我就得到了 Audacity 得到的相同图像。

关于audio - .wav 样本的解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43002306/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com