- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个用于“玻璃 splinter ”声音的单声道 wav 文件。当我使用 librosa 库在 python 中以图形方式显示它的级别时,它显示了非常大的幅度范围,介于 +/20000 而不是 +/- 1 之间。当我使用 Audacity 打开相同的 wav 文件时,级别在 +/- 1 之间。
我的问题是是什么在显示的幅度水平上产生了这种差异,我如何在 Python 中纠正它? MinMax 缩放会扭曲声音,如果可能的话我想避免它。
代码是:
from scipy.io import wavfile
fs1, glass_break_data = wavfile.read('test_break_glass_normalized.wav')
%matplotlib inline
import matplotlib.pyplot as plt
import librosa.display
sr=44100
x = glass_break_data.astype('float')
plt.figure(figsize=(14, 5))
librosa.display.waveplot(x, sr=sr)
最佳答案
WAV 通常使用整数值来表示单个样本,而不是浮点数。所以你在 librosa
中看到的绘图对于 16 位/样本音频文件是准确的。
像 VLC 这样的程序在信息对话框中显示格式,包括每个样本的位深度,以便您轻松检查。
检查格式的另一种方法可能是使用 soxi或 ffmpeg .
Audacity 将所有内容标准化为 -1 到 1 范围内的浮点数——它不会向您显示原始格式。librosa.load()
也是如此。 — 它也归一化为 [-1,1]
. wavfile.read()
另一方面,不规范化。有关读取 WAV 音频的更多信息,请参阅示例 this answer .
关于python-3.x - Wav 音频电平太大,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61251862/
我的音频分析功能在 iPad (2) 上的响应比在 iPhone (4) 上的响应更好。它似乎对 iPad 上更柔和的声音很敏感,而 iPhone 需要更大声的输入才能正确响应。无论这是因为麦克风放置
我试图像这样在 Android 上获取麦克风的振幅电平: MediaRecorder recorder = new MediaRecorder(); recorder.setAudioSource(M
我想知道我的手机的tx level。我有一个 AT 命令终端,我只想要 AT 命令来获取 tx level。 我尝试了这个命令: AT*PSENGI=2 但是调制解调器返回: Error 此命令还返回
我真的很想看到一个独占模式音频应用程序的明确示例,该应用程序在一定的输入电平(音量)下从线路输入(不是麦克风)获取输入,并尽最大努力实现这一目标。 (首选 C++,但有总比没有好) 这听起来应该很简单
我正在构建一个 dB 计作为我正在创建的应用程序的一部分,我已经从我的 iPhone 上的麦克风接收峰值和平均功率(值范围从 -60 到 0.4),现在我需要弄清楚如何将这些功率级别转换为类似于此图表
我是一名优秀的程序员,十分优秀!