gpt4 book ai didi

java - 识别文件中的音频样本

转载 作者:搜寻专家 更新时间:2023-10-31 00:45:17 26 4
gpt4 key购买 nike

我希望能够在我获得的音频文件 (mp3) 中识别音频样本(由用户提供)。

mp3 文件是我为测试目的而保留的 radio 流,我有节目的前卷。我想在文件中识别它并获取它在文件中播放的时间戳。

注意:解决方案可以使用以下任何一种编程语言:Java、Python 或 C++。我不知道如何分析视频文件,有关此主题的任何引用资料都会有所帮助。

最佳答案

这个问题属于音频指纹识别的范畴。如果您已将样本与歌曲匹配,那么您肯定会知道样本在歌曲中出现的时间戳。 Shazam 背后的人有一篇很棒的论文描述了他们的技术:http://www.ee.columbia.edu/~dpwe/papers/Wang03-shazam.pdf他们基本上挑选出频谱图中的局部最大值,并根据它们的相对位置创建一个散列。

这是一篇关于音频指纹识别算法的精彩评论:http://mtg.upf.edu/files/publications/MMSP-2002-pcano.pdf

无论如何,您可能会经常使用 FFT 和频谱图。 This post讨论如何在 Python 中执行此操作。

关于java - 识别文件中的音频样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7052169/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com