gpt4 book ai didi

python - pyaudio 流中的数据是什么意思?

转载 作者:行者123 更新时间:2023-12-03 01:40:22 26 4
gpt4 key购买 nike

我使用 pyaudio 库从声卡中读取声音。我使用以下代码

stream = pyaudio.PyAudio().open(format=pyaudio.paInt16, channels=2,
rate=44100, input=True,
frames_per_buffer=1024)

CHUNK = 1024
frames = []
for i in range(0, int(44100 / 1024 * seconds)):
data = stream.read(CHUNK)
frames.append(data)

我想知道什么是一帧,什么是一大块,它们的格式是什么。图书馆描述中似乎没有这样的信息。

最佳答案

对于以后加入的任何人:

样本是单个 float32 值,它表示在每个特定时间点、特定 channel (如果是立体声,则为左或右)中的音频流的值。

一帧 , 是将在特定时间点播放的所有 channel 的所有值的集合。

取自:Mozilla webaudio description

格式:paInt16 是将这些样本数据存储为 16 位整数值的格式。

DATA:它是您一次从流中获取的 CHUNK 值指定的帧数。将流视为帧的集合。

关于python - pyaudio 流中的数据是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47849529/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com