gpt4 book ai didi

python - 如何使用python wave模块调整音高

转载 作者:行者123 更新时间:2023-12-04 17:29:51 29 4
gpt4 key购买 nike

所以我使用 python wave 模块帧速率方法更改了我的 output.wav 文件的播放速度并将之前的帧速率乘以 2,但我想保持新的 output.wav 的音调相同,因为它听起来很高沥青。怎么做?这是我用于读取和写入 output.wav 的代码片段。我正在寻找简单的解决方案,尽量避免下载外部库。好的波库。

谢谢。

import wave

wf = wave.open('output.wav', 'rb')
RATE = wf.getframerate()
signal = wf.readframes(-1)
channels = wf.getnchannels()
width = wf.getsampwidth()
wf.close()

spf = wave.open('output.wav', 'wb')
spf.setnchannels(channels)
spf.setsampwidth(width)
spf.setframerate(RATE*2)
spf.writeframes(signal)
spf.close()

最佳答案

我写了音高检测函数here但它至少需要 numpy,我认为你应该稍微改变一下。它不太依赖那个库。只是为了更快的结果。

这里有代码,如您所见,这个函数不会随着窗口的大小移动窗口,而是通过一些重叠移动窗口。你应该调整这些特定的代码。numpy 模块有一些用法,我可以很容易地更改它,但我留给你了。

信号处理有很多规则,我已经实现了一些。例如,如果一帧的能量不够,它就没有音调,并且通过发送 -1 而不是音调来显示。

import numpy as np


def pitch_detection(self, frame_matrix, frame_number, lag_vector, frequency):
np.seterr(divide='ignore', invalid='ignore')
pitch_freq_vector = []
for frame in range(frame_number):
ccf = []
frame_expand_1 = frame_matrix[frame-1, :]
frame_expand_2 = frame_matrix[frame-2, :]
temp_corr_1 = frame_matrix[frame, :]
temp_corr_2 = np.append(frame_expand_1[256:], temp_corr_1, axis=0)
temp_corr_2 = np.append(frame_expand_2[192:256], temp_corr_2, axis=0)
len_tc2 = len(temp_corr_2)
for lag in lag_vector: #pitch is the highest correlation in lag vector
ccf.append(np.sum(temp_corr_1*temp_corr_2[len_tc2-lag-512:len_tc2-lag]))
max_index, max_value = max(enumerate(ccf), key=operator.itemgetter(1))
if max(ccf) > 0.3*np.sum(np.power(temp_corr_1, 2)): #if more than 30 detect pitch
pitch_freq_vector.append(max_index)
else:
pitch_freq_vector.append(-1)
return pitch_freq_vector

关于python - 如何使用python wave模块调整音高,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60744773/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com