python - 在顺序读取的多个特征文件上训练 Keras 模型以节省内存-6ren

python - 在顺序读取的多个特征文件上训练 Keras 模型以节省内存

转载作者：太空宇宙更新时间：2023-11-04 08:39:03

26

4

我在尝试读取大量特征文件时遇到了内存问题(见下文)。我想我应该拆分培训文件并按顺序阅读它们。 做到这一点的最佳方法是什么？

x_train = np.load(path_features + 'x_train.npy)
y_train = np.load(path_features + 'y_train.npy)
x_test = np.load(path_features + 'x_test.npy)
y_test = np.load(path_features + 'y_test.npy)

path_models = '../pipelines/' + pipeline + '/models/'

# global params
verbose_level = 1
inp_shape = x_train.shape[1:]

# models
if model_type == 'standard_4':
    print('Starting to train ' + feature_type + '_' + model_type + '.')
    num_classes = 1
    dropout_prob = 0.5
    activation_function = 'relu'
    loss_function = 'binary_crossentropy'
    batch_size = 32
    epoch_count = 100
    opt = SGD(lr=0.001)

    model = Sequential()
    model.add(Conv2D(filters=16, kernel_size=(3, 3), input_shape=inp_shape))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Conv2D(filters=32, kernel_size=(3, 3)))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Flatten())
    model.add(Dense(64, activation=activation_function))
    model.add(Dropout(rate=dropout_prob))
    model.add(Dense(32, activation=activation_function))
    model.add(Dense(num_classes, activation='sigmoid'))
    model.summary()
    model.compile(loss=loss_function, optimizer=opt, metrics=['accuracy'])
    hist = model.fit(x_train, y_train, batch_size=batch_size, epochs=epoch_count,
                     verbose=verbose_level,
                     validation_data=(x_test, y_test))

    model.save(path_models + category + '_' + feature_type + '_' + model_type + '.h5')
    print('Finished training ' + model_type + '.')

    plot_model(hist, path_models, category, feature_type, model_type)
    print('Saved model charts.')

最佳答案

您可以使用 python generator 或 keras sequence .

生成器应该无限期地生成你的批处理:

def myReader(trainOrTest):
    while True:
        do something to define path_features

        x = np.load(path_features + 'x_' + trainOrTest + '.npy')
        y = np.load(path_features + 'y_' + trainOrTest + '.npy')

        #if you're loading them already in a shape accepted by your model:
        yield (x,y)

然后您可以使用 fit_generator 进行训练并使用 predict_generator 来预测值:

model.fit_generator(myReader(trainOrTest),steps_per_epoch=howManyFiles,epochs=.......)

关于python - 在顺序读取的多个特征文件上训练 Keras 模型以节省内存，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46229966/

26

4

0

文章推荐： python - 正则表达式选择包含除一个以外的字符串的列

文章推荐： c - 发送结构数组到函数

文章推荐： c - 如何查看输入文件的第一个字符是否为数字？ C编程

文章推荐： python - 如果 key 在 Python 中包含子字符串

cuda - 节省 cudaHostAlloc 所需的时间
我试图找出在将数据传输到设备之前将数据复制到固定内存是否有意义，因为我对输入数据的分配没有影响(它是一个库)。 std::vector idata(WORK_SIZE); int *idata_ali
node.js - Mongoose 节省
model.save() 让我很困惑。示例。我将我的 mongoose.model(mongoose.schema) 移动到单独的 model.js 文件中。当我使用这种方法创建模型时，以下问题困扰
java - 以毫秒为单位获得实际的 DST 节省
我正在用 Java Swing 制作模拟时钟。要计算我需要的时钟指针角度: 我可以通过 System.currentTimeMillis() 获得的以毫秒为单位的 UTC 时间时区偏移 TimeZo
objective-c - 节省 boolean 值的问题
编辑我的应用程序中有声音，该声音在应用程序启动时开始播放。此外，我还有两种播放和停止声音的方法: -(void)playBgMusic { NSString *path = [[NSBundle m
android - Chronometer 节省 fragment 更改时间
所以我的应用有 1 个 Activity 和 4 个 fragment ，其中一个有 Chronometer 来显示经过了多少时间。它工作正常，但我有一个问题，每次我移动到另一个 fragment
sqlite - FireDAC:节省 SQLite DB 的时间
我是 FireDAC 新手，遇到问题。我想在Delphi XE7中使用FireDAC读写SQLite数据库。我尝试的大部分方法都有效，但我在将 TTime 保存到 SQLite DB 时遇到问题。这
javascript - Node.js Mongodb 集成问题；。节省()
这是我使用基本 Node.js 服务器创建的示例站点。我能够成功发布、创建给定架构的用户，然后“保存”到数据库；但是，保存不会返回用户对象，并且在我的实际数据库中找不到。连接也返回成功。 main.j
linux - 通过绕过 GUI 节省 GPU 内存
我有一台配备 2 Gb Nvidia GPU 的 Mac Book Pro。我正在尝试利用我所有的 GPU 内存进行计算(python 代码)。如果我绕过 GUI 界面并仅通过命令行访问我的机器，我可
vba - 通用 Powerpoint 开发人员控制 VBA 中的值(value)节省
我希望使用 Powerpoint 创建一种测验，我想保存用户提供的输入。例如:如果我问这个问题:你最喜欢什么颜色？当他们回答问题并单击下一步按钮时，我想保存文本框的值并将其附加到输出文件中。我已经

首页

博学

6Ren·AI

商城

python - 在顺序读取的多个特征文件上训练 Keras 模型以节省内存