gpt4 book ai didi

java - 从 AMR-NB 文件中提取音频帧

转载 作者:行者123 更新时间:2023-11-30 11:30:57 27 4
gpt4 key购买 nike

我编写了一个算法来从 AMR 文件中提取每一帧。我认为文件的前 6 个字节是文件头,后面的信息是音频帧。每个音频帧由帧头和音频数据组成。帧头以字节为单位告知帧的大小(使用 CMR 模式表 - http://www.developer.nokia.com/Community/Wiki/AMR_format)。帧大小存储在帧的第一个字节->第二位到第5位,以MSB为第一位。

该算法不起作用,我决定以二进制方式(0 和 1)在屏幕上显示每个字节,有时帧大小数字大于 7 而 CMR 表只有 0...7值(value)观。

CMR 表如下:

CMR      MODE        FRAME SIZE( in bytes )
0 AMR 4.75 13
1 AMR 5.15 14
2 AMR 5.9 16
3 AMR 6.7 18
4 AMR 7.4 20
5 AMR 7.95 21
6 AMR 10.2 27
7 AMR 12.2 32

我的输出(来自 amr 文件的每个字节)是:

0 -> 0 0 0 0 0 0 0 0 
1 -> 0 0 0 0 0 0 0 0
2 -> 0 0 0 0 0 0 0 0
3 -> 0 0 0 1 1 0 0 0
4 -> 0 1 1 0 0 1 1 0
5 -> 0 0 1 0 1 1 1 0
6 -> 1 0 0 1 1 1 1 0
7 -> 0 0 0 0 1 1 1 0
8 -> 1 1 0 0 1 1 0 0
9 -> 1 1 1 0 0 1 1 0
10 -> 0 0 0 0 1 1 1 0
11 -> 0 0 1 0 1 1 0 0
12 -> 0 0 0 0 0 0 0 0
13 -> 0 0 0 0 0 0 0 0
14 -> 0 0 0 0 0 0 0 0
15 -> 0 0 0 0 0 0 0 0
16 -> 1 0 0 1 0 1 1 0
17 -> 1 1 0 0 1 1 1 0
18 -> 1 1 1 1 0 1 1 0
19 -> 1 0 1 1 0 1 1 0
20 -> 1 1 0 0 1 1 0 0
21 -> 1 1 1 0 0 1 1 0
22 -> 0 0 0 0 1 1 1 0
23 -> 0 0 1 0 1 1 0 0
24 -> 0 0 0 0 0 0 0 0
25 -> 0 0 0 0 0 0 0 0
26 -> 0 1 0 0 0 0 0 0
27 -> 1 0 0 1 1 0 0 0
28 -> 1 0 1 1 0 1 1 0
29 -> 1 1 1 1 0 1 1 0
30 -> 1 1 1 1 0 1 1 0
31 -> 0 1 1 0 1 1 1 0
32 -> 0 0 0 0 0 0 0 0
33 -> 0 0 0 0 0 0 0 0
34 -> 0 0 0 0 0 0 0 0
35 -> 0 0 1 1 0 1 1 0
36 -> 1 0 1 1 0 1 1 0
37 -> 0 1 1 0 1 1 1 0
38 -> 0 0 0 1 0 1 1 0
39 -> 0 0 1 0 0 1 1 0
40 -> 0 0 0 0 0 0 0 0

我取了字节 nr 6:10011110 -> 0011 是 nr 3,3 对应的 CMR 值为 18。我跳过 18 个字节,到达字节 nr。 6+18 = 24: 00000000 - 0 的 CMR 值为 13,我跳过了另外 13 个字节 -> 24+13=37: 01101110 -> 1101 is 13 WHICH ISN'T IN CMR table/p>

我做错了什么?我想以二进制方式打印是正确的。下面是读取每一帧的算法(不显示二进制方式):

private void displayNrOfFrames() throws Exception{
FileInputStream fis = null;

try {
fis = new FileInputStream(mFile);
long result = fis.skip(6);
if(result != 6){
throw new Exception("Could not skip first 6 bytes(header) of AMR.");
}

int number = 0;
int bit = 0;
byte b;
BitSet bs;
while((b = Integer.valueOf(fis.read()).byteValue()) != -1){
bs = Util.fromByte(b);
number = 0;
//convert bits [1..4] to number
for (int i = 1; i <= 4; i++) {
bit = bs.get(i)? 1:0;
number += bit*Math.pow(2, 4 - i);
}
System.out.println(number);
if(!CMR_MAP.containsKey(number)){
throw new Exception("Could not parse AMR file.");
}
//skip the number of bytes of this frame.
fis.skip(CMR_MAP.get(number));

}

} catch (IOException e) {
e.printStackTrace();
}
}

[编辑]

看来我在从 byte 到 BitSet 的转换上做错了,然后导致算法失败。在字节 nr.6 处,它应该表示为数字 121,但错误地表示为 nr 158。二进制输出也是错误的,因为它使用相同的转换。我没有检查转换方法(我没有在这里发布)。抱歉打扰了。

最佳答案

我希望我的回复还不算太晚。

首先要做的事情:来自同一个reference你可以看到前 6 个字节(文件头)应该是 0x23、0x21、0x41、0x4D、0x52、0x0A。这是一个常量值,应该始终存在。如果它不存在,则该文件可能已损坏且不应使用。所以你不应该盲目地跳过前 6 个字节。

现在,AMR编解码器支持DTX(不连续传输)。 DTX 只不过是一种通过在声码器检测到静音时生成较少数据来节省带宽的方法。您的 amr 解析器应该准备好等待 DTX。对于 AMR-NB(amr 窄带或简称 amr),DTX 使用模式 8 发出信号。因此您的 CMR map 应包含以下条目

8 AMR SID 6 (SID is silence indicator...indicates that silence period is starting)

在 SID 之后,将有实际的静默帧,其长度为 1 个字节(只是标题...没有数据),因此您应该有条目

15 AMR NO_DATA 1

应该丢弃模式 9-11。模式 12-14 保留供将来使用(通常这些也被丢弃)。考虑到使用的是单 channel AMR,已给出上述所有信息。

在您粘贴的照片中

6 -> 1 0 0 1 1 1 1 0

这应该是 AMR Toc header

    0 1 2 3 4 5 6 7
+-+-+-+-+-+-+-+-+
|F| FT |Q|P|P|
+-+-+-+-+-+-+-+-+

对于存储,F 位应为 0,但在您的示例中为 1。最后两位(填充位)必须为零,但在您的示例中它们不是 0。我相信您的示例没有说明完整故事在这里。

关于java - 从 AMR-NB 文件中提取音频帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17489970/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com