gpt4 book ai didi

python - 为什么要使用udacity gui和scipy从wav文件中提取样本,并给出不同的值?

转载 作者:行者123 更新时间:2023-12-03 00:13:18 25 4
gpt4 key购买 nike

我有一个7秒的音频wav文件:full.wav。

我提取了一个小样本。我使用大胆性选择时间范围并标记时间。我导出标签(包含样本的开始和结束时间)。

1 /我使用audacity菜单导出样本并将其另存为sample_audacity.wav

2 /我使用scipy.io.wavfile.read在python脚本中加载了full.wav
我将样本保存完整[start:end]。它给我sample_python.wav

当我收听sample_audacity.wav和sample_python.wav时,我听到的声音相同。

但是,如果我使用scipy.io.wavfile.read加载这两个文件,则这两个文件的值将有很大不同。
sample_python.wav的值是full.wav的值的子集-正常。

但是sample_audacity.wav的值不是。

有人知道保存原始数据提取时为何胆量会如何/如何修改初始数据(full.wav)吗?

并且,如果可能的话,如何让胆量给我作为具有相同初始数据值(子集)的样本?

例如,sample_audacity.wav的前100个值
[128 122 124 123 134 138 143 142 139 135 144 149 155 156 148 144 143 144
151 152 159 152 160 150 157 151 155 153 155 156 154 151 145 139 128 132
124 131 130 129 123 115 104 100 94 94 88 85 78 74 65 59 52 48
43 45 46 45 40 30 19 10 6 7 14 15 12 0 -8 1 23 51
72 63 55 26 23 20 31 36 40 35 27 22 15 15 7 9 1 -2
-4 0 -3 -4 -18 -25 -25 -12 -1 -9]

sample_audacity.wav的形状:
(36296,)

sample_python.wav的前100个值
[128 127 124 122 125 132 139 143 142 138 137 142 150 155 155 149 144 142
145 150 154 156 156 155 155 154 153 153 154 155 156 154 151 145 138 131
128 127 129 131 129 123 114 105 99 95 93 89 84 79 73 66 59 52
47 44 45 46 45 39 31 19 10 5 8 13 16 11 0 -7 0 23
52 69 68 50 30 20 22 30 37 39 35 28 21 16 13 10 7 2
-3 -3 -1 -1 -6 -17 -26 -24 -12 -2]

sample_python.wav的形状:
(36297,)

大胆2.1.2
的Ubuntu

首选项导入/导出:
enter image description here

导出设置:
enter image description here

两个文件的媒体信息:
enter image description here

最佳答案

将文件导入到audacity后,它将转换为32位格式。当您将文件重新导出回16位时,Audacity将根据首选项使音频抖动。此页面上有更多详细信息:https://wiki.audacityteam.org/wiki/Dither

此导出设置不在明显的位置。转到“首选项/质量”,然后转到“高质量转换”标题下的“抖动”。如果将其设置为None,则应获得与python相同的结果。

关于python - 为什么要使用udacity gui和scipy从wav文件中提取样本,并给出不同的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48923943/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com