gpt4 book ai didi

audio - 从音频文件中删除相同的音频部分

转载 作者:行者123 更新时间:2023-12-03 02:11:18 26 4
gpt4 key购买 nike

作为一名收藏家,我拥有从播客服务下载的数千个音频文件。所有提要都以 15 秒的相同介绍开始。这对我来说很烦人,所以我尝试将它们全部裁剪。

但它们都不是规则的。语音演示完全相同,但其中一些...

  • ...从 00:00 或 00:05 或我们不知道的任何秒开始
  • ...启动时没有介绍

  • 我无法确定应该裁剪哪几秒。

    问题:我们如何根据特定的音频剪辑裁剪所有音频文件?

    用其他说法“检测相同的部分并删除它”?

    最佳答案

    据我了解,您已经有办法在特定点裁剪文件。所以问题归结为找出每个剪辑中介绍的结束位置。这是我的做法:

  • 首先,手动将介绍音频隔离在单独的文件/缓冲区中。
  • 对于每个剪辑,您需要确定在剪辑中出现介绍音频的位置。通过计算 cross-correlation 来做到这一点在介绍音频和主要剪辑之间。正确的偏移量将是具有最高相关系数的偏移量。 (您也可以在均值差中寻找最小值,这是等效的。)
  • 一旦你知道介绍音频的位置,你就可以计算你的裁剪位置。

  • 有一些明显的优化:
  • 仅在每个剪辑的前(例如)30 秒内搜索介绍音频。
  • 不要搜索整个介绍音频,只搜索最后 1/2 秒。
  • 如果您不能 100% 确定音频是否存在,您可能需要设置接受阈值。
  • 关于audio - 从音频文件中删除相同的音频部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23747486/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com