gpt4 book ai didi

ios - 识别 iOS 上的特定声音

转载 作者:可可西里 更新时间:2023-11-01 04:54:50 25 4
gpt4 key购买 nike

我希望能够识别 iOS 应用程序中的特定声音。我猜它基本上会像语音识别一样工作,因为它相当模糊,但它只需要针对一种特定的声音。

我做了一些快速的 FFT 工作来识别超过特定阈值的特定频率,并且只有当它们是单独的(即,它们没有被其他频率包围)时,我才能很容易地识别单个音调。我认为这只是对此的扩展,但与录音的 FFT 数据集相比,并比较音频长度上的 0.1 秒 block 。而且我还必须考虑振幅的变化,一点点的音调和一点点的时间。

任何人都可以指出我可以用来加速这个过程的任何预先存在的资源吗?我似乎找不到任何可用的东西。或者失败了,关于如何开始做这样的事情有什么想法吗?

非常感谢

最佳答案

根据您的描述,您并不完全清楚您想做什么。“特定”的声音是什么样的?它有高背景噪音吗?具体可识别的特征是什么(例如音高、不和谐、音色……)?您想将它与其他哪些“声音”进行比较?您只是想将任意声谱与“模板声音”相匹配吗?你的声音是打击乐的,旋律的,演讲的,......?是长的还是短的……?您期望最佳辨别力的频率范围是多少?这些特征是否随时间不变?

没有适用于所有情况的“通用”解决方案。语音识别本身相当复杂,并且不能很好地识别抽象声音,其可辨别频率不在例如声音中。 MEL strip 。

总而言之,您留下了太多 Unresolved 问题,无法获得有用的答案。根据少量信息,我只能提出以下建议:

For the template sound:1) Extract spectral peak positions from the power spectrum2) Measure the standard deviation around the peaks and construct a gaussian from it3) save the gaussians for later classificationFor unkown sounds:1) Extract spectral peak positions2) Project those points onto the saved gaussians which leaves you with z-scores of the peak positions3) With the computed z-scores you should be able to classify your template sound 

注意:这是一种非常粗略的方法,它根据声音最强大的频率来区分声音。使用高斯分布,它为最强大的频率中的轻微偏移留出了空间。

关于ios - 识别 iOS 上的特定声音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6204495/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com