gpt4 book ai didi

python - 使用 Python 静音后在 PCM WAV 文件中查找索引

转载 作者:太空宇宙 更新时间:2023-11-04 06:38:22 26 4
gpt4 key购买 nike

我需要能够在暂停(静音)后立即找到 WAV 片段的索引,最好以毫秒为单位。我将使用此索引来指示在前一个句子停顿后新句子的语音开始位置。我可以提供一段两三秒的片段,其中包含双方的停顿和讲话。

我看过 Python Wave 如何打开和保存文件,但我不确定如何找到相对静音后的第一个声音并获取索引。

更新:

我的目的是为圣经经文编制索引,以便用户可以选择任何经文并聆听朗读。找到第一个声音提示的索引后,我会将其倒退几十毫秒以进行导入。

谢谢

最佳答案

我在我的应用程序中使用过一次,但我从 SO 复制/粘贴了它。感谢写它的人 ;)

import wave

handle = wave.open('file', 'r')

for i in range(handle.getnframes()):
frame = handle.readframes(i)

zero = True

for j in range(len(frame)):
if ord(frame[j]) > 0:
zero = False
break

if zero:
print 'Silence found at frame {0}'.format(handle.tell())

关于python - 使用 Python 静音后在 PCM WAV 文件中查找索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5250841/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com