gpt4 book ai didi

python - 使用 sounddevice 模块从命令行播放声音样本时延迟太高

转载 作者:行者123 更新时间:2023-12-03 01:45:17 35 4
gpt4 key购买 nike

我想编写一个程序,让我可以用电脑键盘播放样本声音,几乎没有延迟。

我的程序:

import numpy as np
import sounddevice as sd
import soundfile as sf
import msvcrt

sd.default.latency = 'low'

samplesarray = []

def load_samples(num):
filename='sample'+str(num)+'.wav'
data, fs = sf.read(filename, dtype='float32')
sd.default.samplerate = fs
samplesarray.append(data)
return

numberofsamples=3

for i in range(numberofsamples):
load_samples(i+1)

def play_session():
while 0==0:
key = int(msvcrt.getch())
sd.play(samplesarray[key-1])
return

play_session()

程序文件夹包含许多名为 sample1.wav、sample2.wav 等的“one shot”短样本,例如底鼓或军鼓。在此示例中,为简单起见,仅加载了三个。
我可以在终端中启动我当前的程序,并在我的按键上播放“映射”的样本,这正是我想要的。
唯一的问题是延迟:虽然不是很大,但绝对很明显。

对于现场播放样本,理想情况下延迟应该实际上是不可感知的(几十毫秒的数量级)。

我怎么能做到这一点?

最佳答案

除其他事项外,可能的最低延迟取决于您使用的主机 API。由于您正在导入 msvcrt模块,我假设您使用的是 Windows,对吗?

您通常可以在其中选择多个主机 API。使用 WASAPI、WDM/KS 或 ASIO 通常可以达到最低延迟。

如果你使用 WASAPI,你可以试试 exclusive mode ,这可能会降低延迟,但我不确定。

设置latency'low' (正如您所做的那样)应该可以解决问题,但您也可以尝试对 blocksize 使用不同的值.但请注意,太小的 block 大小会导致缓冲区下溢,这可能会导致听到咔嗒声。

最后,如果你真的想从你的设置中挤出最后一点延迟,你应该摆脱sd.play()。 (在每次调用时打开一个新的 sd.OutputStream),而是在您自己的回调函数中实现您的播放逻辑。

关于python - 使用 sounddevice 模块从命令行播放声音样本时延迟太高,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44146445/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com