gpt4 book ai didi

audio - 解码不完整的音频文件

转载 作者:行者123 更新时间:2023-12-03 01:34:21 25 4
gpt4 key购买 nike

给了我一个未压缩的.wav音频文件(360 mb),它似乎已损坏。该文件是使用小型USB记录器记录的(目前我没有有关记录器的更多信息)。任何玩家都无法读取它,我已经尝试过GSpot(https://www.headbands.com/gspot/)来检测它的格式是否可能与wav不同,但无济于事。该文件很大,暗示它是未经压缩的格式。但是,它会丢失文件开头的RIFF-WAVE字符,这可能表明这是其他格式,或者(可能是在这种情况下) header 丢失了。

我尝试将文件的字节直接转换为音频,这会创建一个非常嘈杂的音频文件,尽管可以发出声音,但我能够确定采样率大概为22050hz(假设采样率为8位)文件长度约为4小时45分钟。通过Audition中的某些过滤器运行该文件会导致该文件在某些​​地方可以理解,但在其他地方仍然过于嘈杂。

接下来,我尝试通过一些Java代码运行数据,这些代码会生成字节以外的图像,这给我带来了很多噪音,但是每1024字节还有3字节的间隔。首先是一个接近0或255(但不是100%)的字节,然后是代表一个数字的字节,该数字分布在25左右(但有一些变化),然后是00000000(始终为100%)。第一个“块头”(如我想的那样)位于文件的513字节处,再次接近2幂,例如块大小。对于巧合来说似乎有点太完美了,所以我要提一下它,因为它可能很重要。 https://imgur.com/a/sgZ0JFS,第一个图像显示1024x1024图像,该图像显示文件的前1mb(行方向),第二个图像显示3个“块头”字节的分布。

在这些标题旁边,文件还具有清晰显示结构的区域,几乎是波浪状的结构。我想这是我想要的实际音频,但杂乱无章:https://imgur.com/a/sgZ0JFS,第三张图片,显示了带有音频结构的文件区域。

我还为整个文件创建了一个直方图(忽略了3字节的“块头”):https://imgur.com/a/sgZ0JFS,第四个图像。我已经将范围的下半部分翻转了一下,因为我认为音频数据应该以某个平均值为中心,但是如果我错了,请纠正我。直方图的非对称性质可能与有符号/无符号数据或二进制补码有关。我不知道数据表示形式是8位浮点数还是类似形式。

我现在碰壁了。我不知道我还能尝试什么。有没有人看到我错过的东西。也许有人可以给我一些指导,还有什么可以尝试的。我真的很想从该文件中提取音频数据,因为它包含一些重要信息。

最佳答案

对不起,麻烦了。我已经能够找到录音机的所有者,并让他用它录制一分钟的音频并发送给我。我能够确定音频是IMA 4位ADPCM编码的,而48000hz的16位音频。通过查看文件的结构,我意识到可以将好文件的 header 简单地放在坏文件的数据之前,瞧,我又有了一个工作文件:)

我仍然非常感兴趣ADPCM的工作方式以及是否可以编写自己的解码器,但这又是我再次浏览维基百科的日子。祝大家有个美好的一天!

关于audio - 解码不完整的音频文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54724898/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com