gpt4 book ai didi

python - 在python的音频文件的不同位置插入不同数量的静音

转载 作者:行者123 更新时间:2023-12-03 00:44:15 26 4
gpt4 key购买 nike

我想在python的音频的第二秒,音频的第十秒等处分别插入50毫秒,100毫秒等不同的静音量。
我的音频文件是.wav格式

我发现以下代码:

def silence () 
file = pickAFile()
sound = makeSound(file)
samples = getSamples(sound)

for sampNum in range(44100*2, 44100 * 4):
sample = getSampleObjectAt(sound, sampNum)
setSampleValue(sample,0);

play(sound)

这在以下链接上存在:

link

该链接正在使用JES框架

但是我不了解如何使用我想实现的同一段代码来实现功能。有人可以指导我吗?

最佳答案

音频样本只是一个数字,它定义了特定时间点的音频曲线的高度。在您的代码函数“silence”中,将音频曲线从文件加载到数据结构(阵列)中的“samples”

您的sampNum循环遍历一段索引值,检索每个样本索引的样本值(getSampleObjectAt)...然后将样本值设置为0(setSampleValue)...沉默被规范地定义为值0

音频通常每秒被采样44100次...因此,忽略了我认为由getSampleObjectAt处理的多声道和位深度...该循环从以下位置检索样本:

(44100*2, 44100 * 4)

这意味着它将生成2秒到4秒的样本索引列表

要实现您的目标,只需计算出沉默开始和结束的位置所需的范围
goal A - start at second 2 silence for  50 millisec
- start at 2000 millisec until 2050 millisec
- from 2000 millisec to 2500 millisec

start_sample_index = sample_rate * 2000 / 1000
start_sample_index = 44100 * 2000 / 1000
start_sample_index = 88200

end_sample_index = sample_rate * 2050 / 1000
end_sample_index = 44100 * 2050 / 1000
end_sample_index = 90405

所以在伪代码中(未经测试)
set_silence_from_to_in_millisec(start_time, end_time, sample_rate, sound_obj) :

start_index = sample_rate * start_time / 1000
end_index = sample_rate * end_time / 1000

for sampNum in range(start_index, end_index):
sample = getSampleObjectAt(sound_obj, sampNum)
setSampleValue(sample,0);

所以对于目标A来说,
set_silence_from_to_in_millisec(2000, 2050, 44100, my_sound_obj)

关于python - 在python的音频文件的不同位置插入不同数量的静音,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29141152/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com