gpt4 book ai didi

macos - 音频单元中的等功率交叉淡入淡出?

转载 作者:行者123 更新时间:2023-12-02 07:57:59 25 4
gpt4 key购买 nike

这实际上更多的是一个理论问题,但事实是:

我正在开发一个效果音频单元,它需要干信号和湿信号之间具有相等功率的交叉淡入淡出。

但是我对从线性推子到干流和湿流信号幅度的比例因子(增益)的映射函数的正确方法感到困惑。

基本上,我见过它是用 cos/sin 函数或平方根完成的......本质上近似对数曲线。但是,如果我们对幅度的感知一开始是对数的,那么这些将推子位置映射到幅度的曲线实际上不应该是指数的吗?

这就是我的意思:

假设:

  • signal[i] 表示信号中的第 i 个样本。
  • 每个样本都是一个范围为 [-1, 1] 的 float ,幅度介于 [0,1] 之间。
  • 我们的GUI控件是一个范围在[0,1]之间的NSSlider,所以它在线性原理。
  • fader 是一个具有 NSSlider 值的变量。

第一次观察:我们以对数方式感知振幅。因此,如果我们有一个线性推子,并且仅通过执行以下操作来调整信号的幅度:signal[i] * fader,我们所感知的(听到的,无论数学如何)类似于:

enter image description here

这就是所谓的蹩脚推子效果:我们从静音到 slider 最左边部分的音量急剧增加,经过中间,音量似乎没有变得那么响亮。

因此,为了“正确”地实现推子,我们可以用 dB 标度来表示,然后就信号而言,执行:signal[i] * 10^(fader/20) 或者,如果我们要将推子单位保留在 [0,1] 中,我们可以这样做:signal[i] * (.001*10^(3*fader))

无论哪种方式,我们从 NSSlider 到我们将在代码中用于相乘的推子变量的新映射现在看起来像这样:

enter image description here

这就是我们真正想要的,因为由于我们以对数方式感知振幅,所以我们本质上是从线性(NSSLider范围0-1)映射到指数并提供该指数输出到我们的对数感知。事实证明:log(10^x)=x 因此我们最终以线性(也称为正确)方式感知幅度变化。

太棒了。

现在,我的想法是,两个信号之间的等功率交叉淡入淡出(在本例中是一个干/湿水平 NSSlider,用于将 AU 的输入与其处理后的输出混合在一起)本质上是相同的,只是与一个信号相同 slider 作用于假设信号 dry[i] 和 wet[i]。

因此,如果我的 slider 范围从 0 到 100,并且干是全左,湿是全右),我最终会得到如下代码:

Float32 outputSample, wetSample, drySample = <assume proper initialization>
Float32 mixLevel = .01 * GetParameter(kParameterTypeMixLevel);
Float32 wetPowerLevel = .001 * pow(10, (mixLevel*3));
Float32 dryPowerLevel = .001 * pow(10, ((-3*mixLevel)+1));
outputSample = (wetSample * wetPowerLevel) + (drySample * dryPowerLevel);

其图表如下:

enter image description here

和以前一样,因为我们以对数方式感知幅度,所以这种指数映射实际上应该使其在我们听到交叉淡入淡出的地方呈线性。

但是,我已经看到使用近似值来记录曲线的交叉淡入淡出的实现。意思是:

enter image description here

但是这些曲线难道不会真正强调我们对振幅的对数感知吗?

最佳答案

您所考虑的“等功率”交叉淡入淡出与从湿淡入干时保持混音的总输出功率恒定有关。保持总功率恒定是保持总感知响度恒定的合理近似(这实际上可能相当复杂)。

如果要在两个功率相等的不相关信号之间进行交叉淡入淡出,则可以使用平方值总和为 1 的任意两个函数在交叉淡入淡出期间保持恒定的输出功率。一个常见的示例是函数集

g1(k) = ( 0.5 + 0.5*cos(pi*k) )^.5

g2(k) = ( 0.5 - 0.5*cos(pi*k) )^.5,

其中 0 <= k <= 1(请注意,如上所述,满足 g1(k)^2 + g2(k)^2 = 1 )。以下证明表明这会导致不相关信号的恒定功率交叉淡入淡出:

假设我们有两个具有相等幂的信号 x1(t) 和 x2(t) E[ x1(t)^2 ] = E[ x2(t)^2 ] = Px,它们也是不相关的 ( E[ x1 (t)*x2(t)] = 0)。请注意,满足先前条件的任何增益函数集都将具有 g2(k) = (1 - g1(k)^2)^.5。现在,形成总和 y(t) = g1(k)*x1(t) + g2(k)*x2(t),我们有:

E[ y(t)^2 ] = E[ (g1(k) * x1(t))^2  +  2*g1(k)*(1 - g1(k)^2)^.5 * x1(t) * x2(t)  +  (1 - g1(k)^2) * x2(t)^2 ] 
= g1(k)^2 * E[ x1(t)^2 ] + 2*g1(k)*(1 - g1(k)^2)^.5 * E[ x1(t)*x2(t) ] + (1 - g1(k)^2) * E[ x2(t)^2 ]
= g1(k)^2 * Px + 0 + (1 - g1(k)^2) * Px = Px,

其中我们使用 g1(k) 和 g2(k) 是确定性的,因此可以将其拉到期望运算符 E[ ] 之外,并且根据定义 E[ x1(t)*x2(t) ] = 0因为 x1(t) 和 x2(t) 被假定为不相关。这意味着无论我们处于交叉淡入淡出的哪个位置(无论我们选择什么 k),我们的输出仍将具有相同的功率 Px,因此希望感知的响度相等。

请注意,对于完全相关的信号,您可以通过执行“线性”淡入淡出来实现恒定的输出功率 - 使用 和 两个总和为 1 的函数 ( g1(k) + g2(k) = 1 )。当混合有些相关的信号时,这两者之间的增益函数理论上是合适的。

当你说这句话的时候你在想什么

And same as before, because we perceive amplitude logarithmically, this exponential mapping should actually make it where we hear the crossfade as linear.

是,当应用派生的交叉淡入淡出时,一个信号的响度在感知上应作为 slider 位置 (k) 的线性函数而降低,而另一个信号的响度在感知上应作为 slider 位置的线性函数而增加。虽然您的推导似乎非常正确,但不幸的是,这可能不是在一致性方面混合干信号和湿信号的最佳方法 - 通常,无论 slider 位置如何,保持相同的输出响度是更好的选择。无论如何,可能值得尝试几个不同的功能,看看什么是最有用和一致的。

关于macos - 音频单元中的等功率交叉淡入淡出?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10168842/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com