gpt4 book ai didi

java - 音频样本混合或改变音量会导致饱和度和白噪声

转载 作者:行者123 更新时间:2023-12-03 01:13:00 25 4
gpt4 key购买 nike

我有一个多声道输入(我在 mac 上使用 Soundflower 64ch),我正在尝试将 64 个声道中的 4 个声道混音为立体声输出。
我正在做的是,读取 1024 帧的 block ,每帧有 64 个 channel ,然后将字节缓冲区转换为短数组(值在 -32,768 <-> 32,767 之间,因为样本是 16 位)。
这样我添加例如 channel1[sample] + channel2[sample]我得到了两个 channel 的混合。
但这里有个问题,总和会溢出 Short(16 位)范围,在声音中引入饱和。所以我正在做的是(channel1[sample] + channel2[sample]) / 2但是当我除以 2 时,我听到很多白色的声音。
另外,如果我尝试通过执行 channel1[sample] * 0.5 来减少 channel 的音量有很多饱和度。
为什么会这样?
这是我的完整代码,请注意我将字节转换为短以更好地处理,然后我将转换回字节以将混音写入立体声输出:

public static void main(String[] args) throws LineUnavailableException {

int inputChannels = 64;

AudioFormat inputFormat = new AudioFormat(48000, 16, inputChannels, true, false);
AudioFormat outputFormat = new AudioFormat(48000, 16, 2, true, false);

TargetDataLine mic = AudioSystem.getTargetDataLine(inputFormat);
SourceDataLine speaker = AudioSystem.getSourceDataLine(outputFormat);

mic.open(inputFormat);
speaker.open(outputFormat);
mic.start();
speaker.start();


AudioInputStream audioInputStream = new AudioInputStream(mic);

int bytesPerFrame = audioInputStream.getFormat().getFrameSize();

// Set an arbitrary buffer size of 1024 frames.
int CHUNK = 1024 ;
int numBytes = CHUNK * bytesPerFrame;
byte[] audioBytes = new byte[numBytes];

try {
byte[][] frames = new byte[CHUNK][bytesPerFrame];
int i = 0, j = 0
;
while (true) {
// read to audioBytes.
audioInputStream.read(audioBytes);

// split audioBytes in _CHUNK_ frames (1024 frames)
for(j=0; j<CHUNK; j++) {
frames[j] = Arrays.copyOfRange(audioBytes, j * bytesPerFrame, j * bytesPerFrame + bytesPerFrame);
}

// convert bytearray to shortarray
short[][] shortFrames = new short[CHUNK][inputChannels];
for(i=0; i < frames.length; i++) {
ByteBuffer.wrap(frames[i]).order(ByteOrder.BIG_ENDIAN).asShortBuffer().get(shortFrames[i]);
}

short[] leftOutput = new short[CHUNK*2];
short[] rightOutput = new short[CHUNK*2];

for (i=0; i<CHUNK; i++) {
short channel1 = shortFrames[i][0];
short channel2 = shortFrames[i][1];
short channel3 = shortFrames[i][2];
short channel4 = shortFrames[i][3];

leftOutput[i] = (short)(channel4);
rightOutput[i] = (short)(channel4);;
}


//convert shortarray in byte buffer
ByteBuffer byteBuf = ByteBuffer.allocate(CHUNK * 2 * 2); // 2 bytes * 2 output channels
for (i=0; i<CHUNK; i++) {

byteBuf.putShort(leftOutput[i]);
byteBuf.putShort(rightOutput[i]);
}

speaker.write(byteBuf.array(),0,byteBuf.array().length);

}
} catch (Exception ex) {
// Handle the error...
System.out.println("exception");
System.out.println(ex.toString());
}
}

最佳答案

IDK 如果问题是如何将字节转换为短裤并返回,但既然您在评论中询问了这个问题,我会发布它。假设缓冲区具有 16 位编码的连续小端字节。只需反转 big-endian 的字节索引。

pcmShort = ( buffer[i] & 0xff ) | ( buffer[i+1] << 8 );
我使用的 pcm 到字节的转换如下(对于 little-endian,反转 big-endian 的索引):
outBuffer[i] = (byte)pcmShort[0];
outBuffer[i+1] = (byte)((int)pcmShort[0] >> 8);
也许您可以在相同的数据上并排使用这两种方法(您尝试使用 ByteBuffer 和 getShort 以及上述方法)并检查结果数组是否具有相同的值?
我会尝试做的另一件事是让单轨工作。如果这听起来不错,然后检查混合。信号太热以至于它们溢出是不太可能的。所以其他事情可能正在发生。
我应该自己尝试一下,我不确定什么时候能做到。这可能是对我一直在做的事情的改进。

关于java - 音频样本混合或改变音量会导致饱和度和白噪声,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63238502/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com