python - Keras --- 训练在 fit_generator() 期间卡住-6ren

python - Keras --- 训练在 fit_generator() 期间卡住

转载作者：行者123 更新时间：2023-12-02 16:50:21

25

4

我正在尝试训练我的 6000 个训练数据集和 1000 个验证数据集，但我遇到了一个问题:程序在训练期间卡住并挂起，没有任何错误消息。

1970/6000 [========>.....................] - ETA: 1:50:11 - loss: 1.2256 - accuracy: 0.5956
1971/6000 [========>.....................] - ETA: 1:50:08 - loss: 1.2252 - accuracy: 0.5958
1972/6000 [========>.....................] - ETA: 1:50:08 - loss: 1.2248 - accuracy: 0.5960
1973/6000 [========>.....................] - ETA: 1:50:06 - loss: 1.2245 - accuracy: 0.5962
1974/6000 [========>.....................] - ETA: 1:50:04 - loss: 1.2241 - accuracy: 0.5964
1975/6000 [========>.....................] - ETA: 1:50:02 - loss: 1.2243 - accuracy: 0.5961
1976/6000 [========>.....................] - ETA: 1:50:00 - loss: 1.2239 - accuracy: 0.5963
1977/6000 [========>.....................] - ETA: 1:49:58 - loss: 1.2236 - accuracy: 0.5965
1978/6000 [========>.....................] - ETA: 1:49:57 - loss: 1.2241 - accuracy: 0.5962
1979/6000 [========>.....................] - ETA: 1:49:56 - loss: 1.2237 - accuracy: 0.5964
1980/6000 [========>.....................] - ETA: 1:49:55 - loss: 1.2242 - accuracy: 0.5961
1981/6000 [========>.....................] - ETA: 1:49:53 - loss: 1.2252 - accuracy: 0.5958
1982/6000 [========>.....................] - ETA: 1:49:52 - loss: 1.2257 - accuracy: 0.5955

我等了 5-6 分钟，但似乎什么也没发生。我试着像这样解决

将 steps_per_epoch 更改为 100 并将 epoch 增加到 20
我认为这是 ReduceLROnPlateau 函数的问题，所以我会添加 cooldown =1
但是2个方案都没有解决这个问题

硬件配置:

I5-8300h
GTX 1060 6GB

依赖关系:

凯拉斯 2.3.1
TensorFlow 2.0.0(GPU 版本)

代码如下:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import keras
import tensorflow as tf
from skimage import exposure, color
from keras.optimizers import Adam
from tqdm import tqdm
from keras.models import Model
from keras.utils import to_categorical
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D,Convolution2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras.callbacks import EarlyStopping, ReduceLROnPlateau, ModelCheckpoint, Callback
from keras import regularizers
from keras.applications.densenet import DenseNet121
from keras_preprocessing.image import ImageDataGenerator
from sklearn.utils import class_weight
from collections import Counter

config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth=True
session = tf.compat.v1.Session(config=config)


# Histogram equalization
def HE(img):
    img_eq = exposure.equalize_hist(img)
    return img_eq



def plotImages(images_arr):
    fig, axes = plt.subplots(1, 5, figsize=(20,20))
    axes = axes.flatten()
    for img, ax in zip( images_arr, axes):
        ax.imshow(img)
        ax.axis('off')
    plt.tight_layout()
    plt.show()

train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    rotation_range=40,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest',
    preprocessing_function=HE,
)

validation_datagen = ImageDataGenerator(
    rescale=1./255
)
test_datagen = ImageDataGenerator(
    rescale=1./255
)

#get image and label with augmentation
train = train_datagen.flow_from_directory(
'train/train_deep/',
target_size=(224,224),
class_mode='categorical',
shuffle=False,
batch_size = 20,
)

test = test_datagen.flow_from_directory(
    'test_deep/',
    batch_size=1,
    target_size = (224,224),

)

val = validation_datagen.flow_from_directory(
    'train/validate_deep/',
    target_size=(224,224),
    batch_size = 20,
)
#Training
X_train, y_train = next(train)
class_names = ['No DR', 'Mild', 'Moderate', 'Severe', 'Proliferative DR']
counter = Counter(train.classes)
class_weights = class_weight.compute_class_weight(
               'balanced',
                np.unique(train.classes),
                train.classes)

#X_test , y_test = next(test)
#X_test=np.reshape(X_test,(X_test.shape[0],X_test.shape[1],X_test.shape[2]))
#Training parameter
batch_size =32
Epoch = 2


model = DenseNet121(include_top=True, weights=None, input_tensor=None, input_shape=(224,224,3), pooling=None, classes=5)
model.compile(loss='categorical_crossentropy',
              optimizer=Adam(learning_rate=0.01),
              metrics=['accuracy'])
model.summary()
filepath="weights-improvement-{epoch:02d}-{val_loss:.2f}.hdf5"
checkpointer = ModelCheckpoint(filepath,monitor='val_loss', verbose=1, save_best_only=True,save_weights_only=True)
lr_reduction = ReduceLROnPlateau(monitor='val_loss', patience=5, verbose=2, factor=0.2,cooldown=1)
callbacks_list = [checkpointer, lr_reduction]
#Validation
X_val , y_val = next(val)

#history = model.fit(X_train,y_train,epochs=Epoch,validation_data = (X_val,y_val))

history = model.fit_generator(
    train,
    epochs=Epoch,
    steps_per_epoch=6000,
    class_weight=class_weights,
    validation_data=val,
    validation_steps=1000,
    use_multiprocessing = False,
    max_queue_size=100,
    workers = 1,
    callbacks=callbacks_list
)


# Score trained model.
scores = model.evaluate(X_val, y_val, verbose=1)
print('Test loss:', scores[0])
print('Test accuracy:', scores[1])


#predict
test.reset()
pred=model.predict_generator(test,
steps=25,)

print(pred)
for i in pred:
    print(np.argmax(i))

最佳答案

如果您使用 Keras < 2.0.0(我不建议您使用旧版本)，此代码将运行良好。

您的错误来自于您在 TensorFlow 中使用 Keras > 2.0.0 或 Keras。

您代码中的确切错误来自这些行:

history = model.fit_generator( #change `.fit_generator() to .fit()`
    train,
    epochs=Epoch,
    steps_per_epoch=6000, #change this to 6000//32
    class_weight=class_weights,
    validation_data=val,
    validation_steps=1000, #change this to 1000//32
    use_multiprocessing = False,
    max_queue_size=100,
    workers = 1,
    callbacks=callbacks_list
)

参数“steps_per_epoch”和“validation_steps”必须等于数据集的长度除以批量大小。

关于python - Keras --- 训练在 fit_generator() 期间卡住，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59027150/

25

4

0

文章推荐： vue.js - 如何通过 vue.js 中的 props 传递图片 url

文章推荐： typescript - 如何使用 ts-mockito 模拟一个方法？

ios - 锁定/解锁 iPhone 时 AVCapture session 卡住/卡住
我正在我的 xamarin.forms 应用程序中实现扫描仪功能，为此我正在使用 iOS native AVCaptureSession。但我的问题是在扫描或捕获 session 处于事件状态并且设备
ios媒体选择器仅显示白屏/卡住
所以我目前正在为我的项目制作一个音乐应用程序，它允许用户创建自己的音乐播放列表。但是，当我单击显示媒体选择器按钮时，它只显示白屏，当包含媒体选择器的 View 是 Initial View Contr
Android 模拟器没有响应 - 卡住
当我尝试在模拟器中启动 AVD 时，会出现一个小窗口(见图片)，5 秒后它说没有响应并一直保持这种状态直到我关闭它。我在网上搜索并尝试了所有解决方案，但都没有成功在 BIOS 中启用了虚拟化已安
FFMPEG 帧提取 - 卡住
尝试使用以下命令从视频中提取特定帧(删除了文件的特定名称!: ffmpeg -i video.mp4 -vf "select-gte(n\,6956)"-vframes 10262 文件夹/帧%d.j
ubuntu - 卡住/工作终端？
我怎么知道终端正在继续工作而不中断它？我已经运行了以下 git 命令: clone git://ligo-vcs.phys.uwm.edu/lalsuite.gituote 一段时间后它似乎被卡住了
wpf - 滚动时Datagrid挂起/卡住
我对 WPF 中的数据网格有一个奇怪的问题。我正在为我的应用程序使用 MVVM 模式，并且我的 View 模型实现了 idataerrorinfo 接口(interface)。每当我在添加新行后在我的
输入数据时 Excel 卡住
我有这个 Excel 文件，当我输入数据时它卡住了。例如，我双击一个单元格，输入数据，然后按“输入”。它会卡住而不是进入下面的细胞。按几次“enter”不会解冻程序，唯一有效的是用鼠标选择另一个单元格
c# - 如何知道线程池中的线程挂起/卡住
我有线程池的任务队列，每个任务都有卡住锁定其正在使用的所有资源的倾向。并且除非重新启动服务，否则这些无法释放。 ThreadPool 中有没有办法知道它的线程已经被卡住？我有一个使用超时的想法(虽然我
prolog - 卡住/2个目标阻止已变得无法访问的变量
我制作了以下小程序来确定内存是否用于 freeze(X,Goal) 之类的目标回收时 X变得无法访问: %:- use_module(library(freeze)). % Ciao Prolog n
Java JFrame 卡住
我有一个使用 swing 的简单 java 应用程序。然而，当我执行程序时，框架将会出现，但我无法单击任何地方，并且按钮仅在几秒钟后出现。我对 javas Swing 库非常陌生，所以我可能会丢失一些
Java GUI 卡住
我正在尝试创建一个简单的 TCP 客户端服务器应用程序接口(interface)用户可以在按下相应按钮时启动或停止服务器我创建了一个 StartServer 按钮，当用户按下按钮时它应该连接到服务
Java FTPClient 卡住
我正在尝试从 ftp 服务器下载文件，但在检索文件时卡住了。我正在使用 commons-net-3.6.jar 我注意到的事情当我使用 ftpClient.enterRemotePassiveMod
c++ - SearchPathW 卡住
我正在尝试编写一个函数，该函数将能够找到位于我系统上的可执行文件搜索路径中的任意可执行文件。我遇到了一些输入会导致 SearchPathW 的问题无限期地卡住，我不确定到底发生了什么。 std::op
Nativescript RadSideDrawer 卡住
我的 Nativescript 应用程序的许多页面中都有 RadSideDrawer。主应用程序组件有一个 page-router-outlet并且所有其他页面都通过导航加载到此组件中。带抽屉的页面包
Java - 套接字 - 卡住
我有一个最小的服务器，它等待客户端连接，然后他启动一个线程，将回复发送回客户端，问题是回复。这是服务器的代码: int port = 1234; ServerSocket servSock =
c# - 操作繁忙时表单不执行任何操作(卡住)
我有一个使用 C# 的 WinForms 应用程序。我尝试从文件中读取一些数据并将其插入到数据表中。虽然此操作很忙，但我的表单卡住并且我无法移动它。有谁知道我该如何解决这个问题？最佳答案这可能是因
Javafx GUI 卡住
在我们学校最新的项目中，我遇到了一些问题。我想观察新条目的路径，该路径是由文件导向器按钮选择的，但如果我选择任何文件，整个窗口都会卡住...我猜它被卡住，因为调用了“observePath”方法，但我
输入一百万时 Java 卡住
当我输入一百万作为输入数字时，我的程序卡住了。我该如何解决这个问题？我尝试将第二个 for 循环分离为第二个函数，但没有成功。 import java.io.*; public class Arra
java - transformClassesWithDexBuilderForDebug 卡住
早上好编译我的应用程序时，我在 Android Studio 上遇到问题。我在构建时没有收到关于 app:transformClassesWithDexBuilderForDebug 的任何输出错误，
应用触发器时 PHPMYAdmin 卡住
我正在使用以下触发器 DELIMITER ; CREATE TRIGGER updateCount AFTER INSERT ON user_info FOR EACH ROW BEGIN UPDA

首页

博学

6Ren·AI

商城

python - Keras --- 训练在 fit_generator() 期间卡住