gpt4 book ai didi

python-3.x - 给定两个音频文件,其中一个是另一个的摘要,是否有一种python方法来查找何时在原始文件中重播该摘要?

转载 作者:行者123 更新时间:2023-12-03 01:33:29 25 4
gpt4 key购买 nike

我录制了一些音乐并上传到instagram,这使每个剪辑的持续时间长达一分钟。我丢失了原始文件,并编辑了这些长达一分钟的剪辑,使得song__AA0, song__AA1, song__AA2, ...对应于一首名为AA的歌曲,并重复了BB, CC, ...。但是因为我手动剪辑了视频,所以song__AA1的开头将重复song__AA0结束的片段;同样,song__A2的开头将重复歌曲song__AA1结束的片段。我曾尝试将这些长达一分钟的剪辑串联起来,但是要手动找到修剪文件的确切时间很困难。 python中是否有一种方法可用于查找第i+1首首歌曲和i第首首歌曲重叠的时间,以便我可以相应地连接这些文件?

最佳答案

一种想法是使用音频指纹识别,例如Dejavu。声学指纹是一种压缩的数字摘要,是一种从音频信号确定性生成的指纹,可以用于识别音频样本或快速定位音频数据库中的相似项目。

本质上,dejavu将在音频的spectrograms上创建哈希。

首先,创建或连接到Dejavu将在其中存储指纹的MySQL。

from dejavu import Dejavu
config = {
"database": {
"host": "127.0.0.1",
"user": "root",
"passwd": <password above>,
"db": <name of the database you created above>,
}
}
djv = Dejavu(config)
num_processes = 8
audio_extension = [".mp3", ".wav"]
djv.fingerprint_directory("directory_with_long_songs", audio_extension, num_processes)

现在,您已经创建了指纹,可以进行识别了。
from dejavu.recognize import FileRecognizer
song = djv.recognize(FileRecognizer, "your_shorter.wav")

有关API和输出解释,请查阅文档。
Dejavu是许多此类程序之一。您可以按照以下步骤创建自己的指纹算法: Shazam paper

关于python-3.x - 给定两个音频文件,其中一个是另一个的摘要,是否有一种python方法来查找何时在原始文件中重播该摘要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55664910/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com