gpt4 book ai didi

python - 如何对二维矩阵/图像进行对数缩放

转载 作者:行者123 更新时间:2023-12-04 15:12:28 26 4
gpt4 key购买 nike

我有一个音频频谱图的 2D numpy 数组,我想将它保存为图像。
我正在使用 librosa库来获取频谱。我也可以使用 librosa.display.specshow() 绘制它功能。如下所示,有多种不同的缩放类型。

import PIL
import librosa
import librosa.display

def display_spectrogram(spectrum, sampling_rate):
"""
Frequency types:
‘linear’, ‘fft’, ‘hz’ : frequency range is determined by the FFT window and sampling rate.
‘log’ : the spectrum is displayed on a log scale.
‘mel’ : frequencies are determined by the mel scale.
‘cqt_hz’ : frequencies are determined by the CQT scale.
‘cqt_note’ : pitches are determined by the CQT scale.
"""

librosa.display.specshow(spectrum, sr=sampling_rate, x_axis='time', y_axis='log')
plt.colorbar(format='%+2.0f dB')
plt.title('Spectrogram')
plt.show()
我还可以将频谱图(一个 numpy 数组)转换为图像并保存如下。
img = PIL.Image.fromarray(spectrum)
img.save("out.png")

我有原始频谱图(线性缩放),我想用对数刻度的 y 轴保存它。我查看了 library's source code为了了解它是如何缩放的,但无法弄清楚。
如何对图像/二维 numpy 数组的 y 轴进行日志缩放?

linear matrix
log scaled result

最佳答案

Y 轴的实际对数变换由 matplotlib 完成。你可以通过做 ax.set_yscale('linear') 来测试这个对比 ax.set_yscale('linear') .因此,最简单的替代方法是调整 matplotlib 图形以删除刻度、边框等。这是其中一个示例:https://stackoverflow.com/a/37810568/1967571
如果您想自己进行日志缩放,步骤是

  • 计算 Y 轴上的当前频率。使用 librosa.fft_frequencies
  • 计算 Y 轴上所需的频率。使用 numpy.logspace或类似
  • 以所需频率对频谱图进行采样,例如使用 scipy.interpolate (interp1d)
  • 关于python - 如何对二维矩阵/图像进行对数缩放,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64957506/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com