gpt4 book ai didi

audio - 根据音频(阈值、频率)缩放图像

转载 作者:行者123 更新时间:2023-12-04 23:32:48 35 4
gpt4 key购买 nike

我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件,以获得平滑的效果。
例如,当有脚踢时,比例平滑到 120%,我想让那些音频可视化器,如 dubstep 等......当脚踢进来时,他们的图像是“泵”的。
首先,它可以用ffmpeg吗?
从哪儿开始?
我找到了showcqt它需要输入频率等,但它的输出是视频,所以我认为我不能在我的情况下使用它。任何帮助表示赞赏。

最佳答案

如果您能够在输出 PCM 值时读取它们,那么您可以考虑使用滚动 RMS 平均值以获得连续的幅度流。 IDK 数组的最佳长度。也许它应该对应于可以为每个视觉帧提供更新的音频帧数? DSP site 的人们会有最好的见解。
如果你做一个滚动平均,计算并不是非常昂贵。您将对传入进行平方并将其添加到环形缓冲区(循环队列)并丢弃传出。在计算新的滚动平均值时,只需将这些数据点添加到滚动平均值中,因为分母是固定的且已知的。我发现了一个描述 the basic RMS math here 的视频使用 Matlab。
可能有必要为接收卷更新的可视化器添加一些平滑。此外,从音频线程传递数据可能会采用某种形式的松散耦合。如果处理音频的线程也处理图形,那就不好了。
我有点过头了,但我认为这是通常为可视化者所做的。

关于audio - 根据音频(阈值、频率)缩放图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72923389/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com