gpt4 book ai didi

java - 如何组合两个 AudioInputStream?

转载 作者:行者123 更新时间:2023-12-01 11:08:14 34 4
gpt4 key购买 nike

文件格式为“PCM_SIGNED 44100.0 Hz,16位,立体声,4字节/帧,小端”,我想在放大两个文件之一的同时将它们添加在一起。我计划读取两个 wav 将它们放入两个 audioinputstream 实例中,然后将实例存储到两个 byte[] 数组中,在数组中进行操作,并作为另一个 audioinputstream 实例返回。

我做了很多研究,但没有得到好的结果。我知道这是 www.jsresources.org 中的一个类,混合两个音频输入流,但它不允许我在混合之前修改两个流中的任何一个,而我想在混合之前减少其中一个流。你认为我应该做什么?

最佳答案

为此,您可以将流转换为 PCM 数据,将要更改音量的 channel 乘以所需系数,将结果中的 PCM 数据相加,然后转换回字节。

要按字节访问音频流,请查看 Using Files and Format Converters 上 Java 教程部分的第一个扩展代码片段。 。这展示了如何获取声音字节数据的数组。有一条评论写道:

  // Here, do something useful with the audio data that's 
// now in the audioBytes array...

此时,迭代字节,转换为 PCM。基于以下内容的一组命令应该可以工作:

for (int i = 0; i < numBytes; i += 2)
{
pcmA[i/2] = audioBytesA[i] & 0xff ) | ( audioBytesA[i + 1] << 8 );
pcmB[i/2] = audioBytesB[i] & 0xff ) | ( audioBytesB[i + 1] << 8 );
}

在上面,audioBytesAaudioBytesB是两个输入流(名称基于示例中的代码),pcmA和< strong>pcmB 可以是 int 数组或 short 数组,保存适合 short 范围内的值。最好使 pcm 数组浮点,因为您将进行一些会产生分数的数学运算。使用floats(如下面的示例所示)仅增加一位精度(比使用int时更好的舍入),并且int执行速度更快。我认为如果音频数据被标准化以用于额外处理,则更经常使用 float 。

从这里开始,改变音量的最佳方法是将每个 PCM 值乘以相同的量。例如,要将音量增加 25%,

pcmA[i] = pcmA[i] * 1.25f; 

然后,将 pcmA 和 pcmB 相加,并转换回字节。您可能还需要放入 min 或 max 函数,以确保音量和合并不会超过适合格式 16 位的值。

我使用以下内容转换回字节:

for (int i = 0; i < numBytes; i++)
{
outBuffer[i*2] = (byte) pcmCombined[i];
outBuffer[(i*2) + 1] = (byte)((int)pcmCombined[i] >> 8 );
}

上面假设 pcmCombined[] 是一个 float 组。如果是short[]或int[]数组,转换代码会简单一些。

我从为 my website 发布的程序所做的开发工作中剪切并粘贴了上述内容。 ,并根据您的场景进行了编辑,因此如果有拼写错误或错误,请在评论中告诉我,我会修复它。

关于java - 如何组合两个 AudioInputStream?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32690817/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com