gpt4 book ai didi

python - 尝试使用 VGG16 keras 模型进行音频

转载 作者:行者123 更新时间:2023-12-03 01:15:41 24 4
gpt4 key购买 nike

我正在尝试使用 vgg16 keras 模型进行声音预测。
我只是为我的预测更改最后一层:

base_model = VGG16(include_top=False,
input_shape = (128,431,3),
weights = 'imagenet')

model = Sequential()
model.add(base_model)
model.add(GlobalAveragePooling2D())
model.add(Dense(1024,activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1,activation='sigmoid'))
model.summary()

我的数据的形状是: (128,431,1)(我从 librosa 库中使用 mel_spectrogram 获得它)
但是 Keras 模型需要 (128,431,3)我尝试使用 numpy 的 stack 方法,但进程停止了。我认为这是因为数据太多。

最佳答案

问题在于使用 imagenet 权重。要求 channel 数为3。创建模型时,设置权重为None它应该可以工作。

import keras
base_model = keras.applications.vgg16.VGG16(include_top=False,
input_shape = (128,431,1),
weights = None)

关于python - 尝试使用 VGG16 keras 模型进行音频,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62514635/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com