gpt4 book ai didi

android - 声学指纹识别背后的原理是什么?

转载 作者:行者123 更新时间:2023-11-28 21:24:54 25 4
gpt4 key购买 nike

使用什么样的 API 或框架来为音符赋值?就像 Shazzam 这样的应用程序如何从麦克风中获取音符并知道如何处理它?对我来说,手机麦克风和一些漂亮的逻辑可以与音乐商店的调谐器竞争,真是太神奇了!

编辑 1.

关于该主题的有趣论文。Shazzam 音乐识别应用软件 取决于原理Acoustic fingerprinting和一个 Fast Fourier Transform

这是一个例子,在 practice 中有一些类似的代码

最佳答案

声学指纹算法不会尝试分析音乐。也就是说,它们不会将麦克风的音频转换为音符。他们从音频中提取一些任意特征,从音乐理论的角度来看没有多大意义,但它们对于识别音乐仍然有用。

通常,您从频谱图开始。频谱图是对频率随时间变化的分析。这对于几乎所有声学指纹识别算法都是常见的。不同之处在于他们对频谱图的处理方式以及他们从中提取的特征类型。一些算法正在寻找频谱图中的峰值,一些算法将其分成规则的间隔。最终目标通常是生成一堆可以索引和快速搜索的哈希值。

Avery Li-Chun Wang 的原始 Shazam 算法是公开的。详情可以找here .

关于android - 声学指纹识别背后的原理是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38497597/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com