gpt4 book ai didi

c++ - 修改音频样本缓冲区的音量增益

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:29:11 25 4
gpt4 key购买 nike

我想增加语音数据缓冲区的音量。关键是我正在使用 DirectSound,并且我有一个主缓冲区和一个辅助缓冲区 - 所有流混合都是手动完成的。在语音聊天中,所有参与者都可以有独立的音量级别。我将每个流数据乘以一个值(增益)并将其加到一个缓冲区中。一切正常,但当我尝试将数据乘以大于 1.0f 的值时 - 我听到一些削波或其他声音。

我试过使用 Audacity 效果压缩器,但这无助于减少奇怪的噪音。

也许我应该以其他方式修改增益?或者只是使用另一种后处理算法?

更新:哇,我刚刚发现了一件有趣的事情!我在增加音量之前和之后都转储了音频。

这是图片 Clipped audio

对不起质量 - 我认为这就是声音应该出现的方式(我自己画了红线)。看起来值确实超出了示例数据类型。但我不明白为什么?我的样本缓冲区是 BYTE,但我只能通过短指针访问它。它已签名,但即使 *ptr 约为 15-20 千时也会发生裁剪。

最佳答案

对于每个样本 - 将其转换为某种更大的数据类型 - 如果您有 16 位有符号样本,它们最初适合 SHORT - 从流中提取它,然后转换为本地 double ,然后乘法,然后 CLIP,然后转换回做空。

它必须这样工作......

如果需要,我什至可以提供代码示例。

编辑:

您的图片是您在乘法之前没有扩展到更大类型的确切证据 - 您无法在 SHORT 上“捕获”裁剪条件,因为它会自动换行。

short* sampleBuffer;
...
short sample=*sampleBuffer;
double dsample=(double)sample * gain;
if (dsample>32767.0) {dsample=32767.0;}
if (dsample<-32768.0) {dsample=-32768.0;}
*sampleBuffer=(short)dsample;
sampleBuffer++;

还有一个编辑:

如果您有多个声音 - 首先将它们全部加倍 - 然后对每个声音进行增益 - 然后添加它们 - 最后将它们剪辑。

再编辑(+1 激励我):

如果你有 STEREO,同样的东西也可以工作,只需计算所有样本 x2 即

短裤数量 = 样本数量 * 2.

关于c++ - 修改音频样本缓冲区的音量增益,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4300995/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com