gpt4 book ai didi

python - 检测音频文件中的声音边界

转载 作者:太空宇宙 更新时间:2023-11-03 22:04:55 24 4
gpt4 key购买 nike

我有一个音频文件,我想拆分成多个文件。这些文件被构造成由静音隔开的成对声音。时间轴看起来像这样用 - 表示沉默:

-----声音A1-----声音A2-----声音B1-----声音B2-----

我想找到声音 A2 和声音 B1 之间的边界。我想要一个最好结合使用 Python、OpenCV 和 FFmpeg 的解决方案,但任何可用的工具都可以。

最佳答案

感谢 Miki 提供的链接。 Aubio是一个完美的工具。程序 aubioquiet 将检测静默边界并打印它们的时间戳:

$ aubioquiet temp.wav
嘈杂:0.638549
安静:2.008526
嘈杂:4.992290
安静:6.286803
嘈杂:9.258957
安静:10.559275
嘈杂:13.531428
安静:14.622766
嘈杂:17.623945
安静:18.953287
嘈杂:21.931248
安静:23.260590
嘈杂:26.238548
安静:27.643356
嘈杂:30.632925
安静:31.915827
嘈杂:34.882175
安静:36.165081

关于python - 检测音频文件中的声音边界,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31764821/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com