gpt4 book ai didi

python - python中的视频和音频处理库

转载 作者:太空宇宙 更新时间:2023-11-03 11:10:07 28 4
gpt4 key购买 nike

Python 中有哪些视频/音频库可用于识别视频录制中的特定音频模式?
我试图从视频文件中排除录音的开头(跳到特定的音频模式),因此我需要一种方法来

  • 从头扫描文件
  • 识别音频模式(一段特定的音乐总是相同的)
  • 从那时起录制/复制剩余的视频记录。

视频详情

格式 :- Real Media(没关系,因为我可以将它转换成更多格式)

长度:- 从 18 到 24 分钟不等

在一个这样的视频上运行媒体信息工具会提供以下详细信息

Video
ID : 1
Format : RealVideo 4
Codec ID : RV40
Codec ID/Info : Based on AVC (H.264), Real Player 9
Duration : 19mn 18s
Bit rate : 195 Kbps
Width : 332 pixels
Height : 248 pixels
Display aspect ratio : 4:3
Frame rate : 23.976 fps
Bits/(Pixel*Frame) : 0.099
Stream size : 27.0 MiB (84%)

Audio
ID : 0
Format : Cooker
Codec ID : cook
Codec ID/Info : Based on G.722.1, Real Player 6
Duration : 19mn 20s
Bit rate : 32.0 Kbps
Channel(s) : 2 channels
Sampling rate : 44.1 KHz
Bit depth : 16 bits
Stream size : 4.43 MiB (14%)

原始问题:

所以前几天我重温了一个动画系列龙珠 z 并且被我的视频激怒了。每集约 24 分钟,每集都有对前一集的完整回顾和结束音乐,总时长约 6-8 分钟。

我注意到当重述结束并且视频的新名称出现时,每个视频都有相同的音频。我将这段音频录制在一个单独的文件中。

我想问一下在 python 中是否有任何方法可以通过编码来完成以下操作:=

  1. 扫描音频以匹配标题名称的录制音频,以了解实际视频开始的确切时间。

  2. 将视频保存为从该点开始。

我不知道这样做的难度,所以如果可能的话请告诉我。

如果您能告诉任何确实为我提供工具的图书馆并给我一些关于我应该如何继续的提示,我将不胜感激。

非常感谢

最佳答案

据我所知,语音识别(也公开了较低级别的功能,为两个声音之间的相似性打分)仅在 Python 中受支持 through windows librariesdragon naturally speaking API .

找到标记后,您可以使用外部库,如 thisthis根据要求剪切视频。

编辑:谷歌搜索也返回了 pyofa围绕 musicip-libofa 的包装这是一个acousting fingerprint图书馆。

关于python - python中的视频和音频处理库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6681540/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com