audio - 如何找到吉他弦声音的基频？-6ren

audio - 如何找到吉他弦声音的基频？

转载作者：行者123 更新时间：2023-12-02 05:33:20

26

4

我想为 Iphone 构建一个吉他调音器应用程序。我的目标是找到吉他弦产生的声音的基频。我使用了 Apple 提供的 aurioTouch 示例中的一些代码来计算频谱，并找到了幅度最高的频率。它对于纯声音(只有一种频率的声音)效果很好，但对于来自吉他弦的声音，它会产生错误的结果。我读到这是因为吉他弦产生的泛音可能具有比基音更高的振幅。如何找到适用于吉他弦的基频？ C/C++/Obj-C 中是否有用于声音分析(或信号处理)的开源库？

最佳答案

您可以使用信号的自相关，它是 DFT 幅度平方的逆变换。如果您以 44100 个样本/秒的速率进行采样，则 82.4 Hz 基波大约有 535 个样本，而 1479.98 Hz 大约有 30 个样本。查找该范围内的峰值正滞后(例如从 28 到 560)。确保您的窗口至少是最长基本面的两个周期，此处为 1070 个样本。 2 的下一个幂就是 2048 个样本缓冲区。为了获得更好的频率分辨率和更少偏差的估计，请使用更长的缓冲区，但不要太长，以免信号不再近似静止。下面是一个 Python 示例:

from pylab import *
import wave

fs = 44100.0   # sample rate
K = 3          # number of windows
L = 8192       # 1st pass window overlap, 50%
M = 16384      # 1st pass window length
N = 32768      # 1st pass DFT lenth: acyclic correlation

# load a sample of guitar playing an open string 6
# with a fundamental frequency of 82.4 Hz (in theory),
# but this sample is actually at about 81.97 Hz
g = fromstring(wave.open('dist_gtr_6.wav').readframes(-1),
               dtype='int16')
g = g / float64(max(abs(g)))    # normalize to +/- 1.0
mi = len(g) / 4                 # start index

def welch(x, w, L, N):
    # Welch's method
    M = len(w)
    K = (len(x) - L) / (M - L)
    Xsq = zeros(N/2+1)                  # len(N-point rfft) = N/2+1
    for k in range(K):
        m = k * ( M - L)
        xt = w * x[m:m+M]
        # use rfft for efficiency (assumes x is real-valued)
        Xsq = Xsq + abs(rfft(xt, N)) ** 2
    Xsq = Xsq / K
    Wsq = abs(rfft(w, N)) ** 2
    bias = irfft(Wsq)                   # for unbiasing Rxx and Sxx
    p = dot(x,x) / len(x)               # avg power, used as a check
    return Xsq, bias, p

# first pass: acyclic autocorrelation
x = g[mi:mi + K*M - (K-1)*L]        # len(x) = 32768
w = hamming(M)                      # hamming[m] = 0.54 - 0.46*cos(2*pi*m/M)
                                    # reduces the side lobes in DFT
Xsq, bias, p = welch(x, w, L, N)
Rxx = irfft(Xsq)                    # acyclic autocorrelation
Rxx = Rxx / bias                    # unbias (bias is tapered)
mp = argmax(Rxx[28:561]) + 28       # index of 1st peak in 28 to 560

# 2nd pass: cyclic autocorrelation
N = M = L - (L % mp)                # window an integer number of periods
                                    # shortened to ~8192 for stationarity
x = g[mi:mi+K*M]                    # data for K windows
w = ones(M); L = 0                  # rectangular, non-overlaping
Xsq, bias, p = welch(x, w, L, N)
Rxx = irfft(Xsq)                    # cyclic autocorrelation
Rxx = Rxx / bias                    # unbias (bias is constant)
mp = argmax(Rxx[28:561]) + 28       # index of 1st peak in 28 to 560

Sxx = Xsq / bias[0]
Sxx[1:-1] = 2 * Sxx[1:-1]           # fold the freq axis
Sxx = Sxx / N                       # normalize S for avg power
n0 = N / mp
np = argmax(Sxx[n0-2:n0+3]) + n0-2  # bin of the nearest peak power

# check
print "\nAverage Power"
print "  p:", p
print "Rxx:", Rxx[0]                # should equal dot product, p
print "Sxx:", sum(Sxx), '\n'        # should equal Rxx[0]

figure().subplots_adjust(hspace=0.5)
subplot2grid((2,1), (0,0))
title('Autocorrelation, R$_{xx}$'); xlabel('Lags')
mr = r_[:3 * mp]
plot(Rxx[mr]); plot(mp, Rxx[mp], 'ro')
xticks(mp/2 * r_[1:6])
grid(); axis('tight'); ylim(1.25*min(Rxx), 1.25*max(Rxx))

subplot2grid((2,1), (1,0))
title('Power Spectral Density, S$_{xx}$'); xlabel('Frequency (Hz)')
fr = r_[:5 * np]; f = fs * fr / N; 
vlines(f, 0, Sxx[fr], colors='b', linewidth=2)
xticks((fs * np/N  * r_[1:5]).round(3))
grid(); axis('tight'); ylim(0,1.25*max(Sxx[fr]))
show()

Rxx and Sxx

输出:

Average Power
  p: 0.0410611012542
Rxx: 0.0410611012542
Sxx: 0.0410611012542

峰值滞后为 538，即 44100/538 = 81.97 Hz。首轮非循环 DFT 显示 bin 61 处的基波，即 82.10 +/- 0.67 Hz。第二遍使用 538*15 = 8070 的窗口长度，因此 DFT 频率包括弦的基波周期和谐波。这可以实现泛化循环自相关，从而以更少的谐波扩展来改进 PSD 估计(即相关性可以周期性地环绕窗口)。

编辑:更新为使用韦尔奇方法来估计自相关。重叠窗口可以补偿汉明窗。我还计算了汉明窗的锥形偏差以消除自相关的偏差。

编辑:添加了具有循环相关性的第二遍以清理功率谱密度。此过程使用 3 个不重叠的矩形窗口，长度为 538*15 = 8070(足够短以几乎静止)。循环相关的偏差是一个常数，而不是汉明窗的锥形偏差。

关于audio - 如何找到吉他弦声音的基频？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5044289/

26

4

0

文章推荐： r - 从 QR 分解中获取帽子矩阵以进行加权最小二乘回归

文章推荐： actionscript-3 - AS3 : weird getBounds() result

文章推荐： d - 标准 D 类型和 GDC (LDC) 规范

class - 模板方法模式和使用抽象(基)类之间的区别？
经过几个小时的(重新)搜索，我无法想出普通抽象类和使用模板模式之间的可解释区别。我唯一看到的是: 使用抽象类时，您需要实现所有方法。但是在使用模板方法时，您只需要实现这两个抽象方法。有人可以向我解
algorithm - 从直骨架中提取的最小 Cyle 基
我正在尝试实现一种算法，该算法可找到以下形状给出的外多边形的每个单独边的对应区域。也就是说，1,2 边的相应区域是 [1,6,7,8,2]，2,3 边的区域是 [2,8,3] 等等，CCW 或 CW
c# - 基 Controller 类的属性注入(inject)
我正在尝试在派生 self 的 BaseController 类的任何 Controller 上自动设置一个属性。这是我的 Application_Start 方法中的代码。 UnitOfWork 属
r - 在自适应平滑中提取 P 样条的节点、基、系数和预测
我正在使用 mgcv 包通过以下方式将一些多项式样条拟合到一些数据: x.gam smooth$knots [1] -0.081161 -0.054107 -0.027053 0.000001
c - C语言中被调用(派生)函数如何访问调用者(基)函数的变量？
考虑以下代码: void foo(){ ..... } int main() { int arr[3][3] ; char string[10]; foo();
c++ - 使用 dynamic_cast 向上转换到 protected 基
本书The c++ programming language有这个代码: class BB_ival_slider : public Ival_slider, protected BBslider {
javascript - NPM package.json 基/根属性？
是否有一个 package.json 属性可用于指定模块解析应启动的根文件夹？例如，假设我们在 node_modules/mypackage/src/file1 中有一个安装。我们要导入的所有文件都
sql - 基 R : Aggregate and sum by two columns
我正在尝试使用聚合函数来实现与 SQL 查询相同的结果: 查询语句: sqldf(" SELECT PhotoID, UserID,
r - 如果可能，在 R - 基 R 中着色置信区间
我正在比较使用 LOESS 回归的两条线。我想清楚地显示两条线的置信区间，我遇到了一些困难。我尝试过使用各种线型和颜色，但在我看来，结果仍然是忙碌和凌乱。我认为置信区间之间的阴影可能会使事情变得更清
c# - 具有抽象(基)/具体(继承)类的 DataContractSerializer
给定这段代码 public override void Serialize(BaseContentObject obj) { string file = ObjectDataStoreFold
c++ - 多态性是否适用于值？或者在按(基)值返回时使用派生类的 move 构造函数
我正在构建某种工厂方法，它按以下方式将 DerivedClass 作为 BaseClass 返回: BaseClass Factory() { return DerivedClass(); }
kotlin - 从重写中使用类委托(delegate)时调用(基)委托(delegate)函数
当重写 class delegation 实现的接口(interface)方法时，是否可以调用通常从重写函数中委托(delegate)给的类？类似于使用继承时调用 super 的方式。来自docum
java - 基 fragment 类中的共享变量是公共(public)的还是私有(private)的？
我有一个基类 fragment (如下所示)。我在其他 3 个 fragment 类中扩展了此类，每个类都共享需要在这 3 个 fragment 中访问的相同 EditText。因此，我在基类中设置了
r - 基 R 中排列之间的 Kendall tau 距离(又名冒泡排序距离)
如何在不加载额外库的情况下在 R 中计算两个排列之间的 Kendall tau 距离(又名冒泡排序距离)？最佳答案这是一个 O(n.log(n)) 的实现，在阅读后拼凑而成，但我怀疑可能有更好的
angular - 在 ng build --prod --localize 时更改 Angular 基 href
情况我创建了一个具有国际化 (i18n) 的 Angular 应用程序。我想在子域中托管不同的版本，例如: zh.myexample.com es.myexample.com 问题当我使用命令 n
c++ - 为什么要检查 Base 是 Derived 的私有(private)基还是 protected 基？
std::is_base_of 之间的唯一区别和 std::is_convertible是前者在 Base 时也成立是私有(private)或 protected Derived 的基类.但是，您何
ios - 如何将子类 View Controller 的 View 放入父类(super class)基 View Controller 的内容 View 中？
我创建了一个名为 baseviewcontroller 的父类(super class) uiviewcontroller 类，用于包含大多数应用屏幕所需的基本 UI。它包括一个自定义导航栏和一个“自

首页

博学

6Ren·AI

商城

audio - 如何找到吉他弦声音的基频？