gpt4 book ai didi

bash - play stat -freq 输出是什么意思?

转载 作者:行者123 更新时间:2023-12-03 02:30:24 25 4
gpt4 key购买 nike

play $file stat -freq 的输出是什么意思是?

我最近运行了命令,这是输出示例:

$ play 44100Hz/3660/6517/3660-6517-0024.flac stat -freq

44100Hz/3660/6517/3660-6517-0024.flac:

File Size: 214k Bit Rate: 325k
Encoding: FLAC Info: Processed by SoX
Channels: 1 @ 16-bit
Samplerate: 44100Hz
Replaygain: off
Duration: 00:00:05.28

In:0.00% 00:00:00.00 [00:00:05.28] Out:0 [ | ] Clip:0 0.000000 0.412632
10.766602 0.430416
21.533203 0.750785
32.299805 0.839694
43.066406 0.989763
53.833008 0.435572
64.599609 0.404773
75.366211 0.048392
86.132812 0.025195
96.899414 0.011314
...
In:3.52% 00:00:00.19 [00:00:05.09] Out:4.10k [ | ] Clip:0 0.000000 0.889006
10.766602 0.092675
21.533203 0.785106
32.299805 1.693663
43.066406 0.990839
53.833008 0.044969
64.599609 0.096066
75.366211 0.121797
86.132812 0.256809
96.899414 0.122486
107.666016 0.019195
...

我该如何理解这一点?

我希望这是一些傅立叶变换,上面的输出代表一个表格
Frequency | Level

但我不知道这是否真的是这样,或者如果是这样的话,会以什么水平来衡量。

In:% 开头的行是什么?意思是?以 Clip:0 ... 结尾.

请有人向我解释这个命令的输出。

最佳答案

来自手册页 here :

The −freq option calculates the input’s power spectrum (4096 point DFT) instead of the statistics listed above. This should only be used with a single channel audio file.



正如你所说,它是一个频率/电平表。
所以最后一个频率或多或少是采样率的一半。
我用纯音(大胆产生)尝试了它,效果很好。

请注意,如果每个 channel 的文件长度超过 4096 字节,那么您将看到几组 DFT,因为每个 DFT 窗口的长度为 4096。如果是这样,那么您将看到多个表连接在一起。

我没有任何“%”。您是否按照文档中的说明将音频文件转换为单声道?

关于bash - play stat -freq 输出是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47452888/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com