gpt4 book ai didi

python - 如何从 python 中的 wav 文件中删除静音期?

转载 作者:行者123 更新时间:2023-12-02 23:27:10 27 4
gpt4 key购买 nike

我有一个 wav 文件的对话(客户服务)我将它分成 2 个音频 channel 。现在我有 2 个 wav 文件,每个人都在说话,并且有静默期。我需要剪掉那些沉默的时间,以将所有人的话“压缩”在较短的文件中。

我用谷歌搜索并找到了这个 link .它有这样的代码:

def addFrameWithTransition(self, image_file, audio_file, transition_file):
media_info = MediaInfo.parse(transition_file)
duration_in_ms = media_info.tracks[0].duration
audio_file = audio_file.replace("\\", "/")
try:
audio_clip = AudioSegment.from_wav(r"%s"%audio_file)
f = sf.SoundFile(r"%s"%audio_file)
except Exception as e:
print(e)
audio_clip = AudioSegment.from_wav("%s/pause.wav" % settings.assetPath)
f = sf.SoundFile("%s/pause.wav" % settings.assetPath)
duration = (len(f) / f.samplerate)
audio_clip_with_pause = audio_clip
self.imageframes.append(image_file)
self.audiofiles.append(audio_clip_with_pause)
self.durations.append(duration)
self.transitions.append((transition_file, len(self.imageframes) - 1, duration_in_ms / 1000))

但它需要某种“图像文件”。还有其他选择吗?

最佳答案

我找到了一个小的 vad.py 文件,它将对话分成两部分,并实际压缩了每个音轨。最后你将有 2 个 wav 文件,只有 1 个人说话。

https://github.com/mauriciovander/silence-removal/blob/master/vad.py

像这样工作:

python vad name_of_new_file.wav

关于python - 如何从 python 中的 wav 文件中删除静音期?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61138969/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com