- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有大约 6200 张训练图像,我想使用 keras.preprocessing.image.ImageDataGenerator
类的 flow(X, y)
方法来扩充小图像数据集如下:
train_datagen = ImageDataGenerator(
rescale=1./255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
test_datagen = ImageDataGenerator(rescale=1./255)
train_generator = train_datagen.flow(X_train , y_train)
validation_generator = test_datagen.flow(X_val , y_val)
history = model.fit_generator(
train_generator,
samples_per_epoch=1920,
nb_epoch=10,
verbose=1,
validation_data=validation_generator,
nb_val_samples=800)
其中 X_train
/y_train
包含大约 6000 个训练图像和标签以及 X_val
/y_val
验证数据和模型是一个增强的 VGG16 模型。
文档说
flow(X, y): Takes numpy data & label arrays, and generates batches of augmented/normalized data. Yields batches indefinitely, in an infinite loop.
对于具有 10 个时期、每个时期 1920 个样本且 batch_size 为 32 的训练设置,我得到以下训练轨迹:
1920/1920 [==============================] - 3525s - loss: 3.9101 - val_loss: 0.0269
Epoch 2/10
1920/1920 [==============================] - 3609s - loss: 1.0245 - val_loss: 0.0229
Epoch 3/10
1920/1920 [==============================] - 3201s - loss: 0.7620 - val_loss: 0.0161
Epoch 4/10
1916/1920 [============================>.] - ETA: 4s - loss: 0.5978 C:\Miniconda3\envs\carnd-term1\lib\site-packages\keras\engine\training.py:1537: UserWarning: Epoch comprised more than `samples_per_epoch` samples, which might affect learning results. Set `samples_per_epoch` correctly to avoid this warning.
warnings.warn('Epoch comprised more than
为什么生成器没有像文档中所说的那样生成无限批处理?
最佳答案
所以基本上 KerasImageGenerator
类实现中存在一个小错误。好的是——除了这个烦人的警告之外,没有发生任何错误。所以澄清一下:
flow
和 flow_from_directory
实际上都是在无限循环中生成样本。您可以通过测试以下代码轻松检查(警告 - 它会卡住您的 Python
):
for x, y in train_generator:
x = None
您提到的警告在 fit_generator
方法中出现。它主要检查一个时期内处理的样本数量是否小于或等于 samples_per_epoch
。在您的情况下 - samples_per_epoch
可被 batch_size
整除 - 如果 Keras 的实现是正确的 - 永远不应发出此警告......但是..
.. 是的,为什么会发出这个警告?这有点棘手。如果您更深入地研究生成器的实现,您会注意到生成器以下列方式获取批处理:如果您有 10 个示例和 batch_size = 3
,则:
不要问我为什么 - 这就是生成器的实现方式。好在它几乎不影响训练过程。
因此 - 总而言之 - 您可以忽略此警告,也可以使传递给生成器的样本数可以被 batch_size
整除。我知道这很麻烦,我希望它会在下一个版本中得到修复。
关于python - 凯拉斯警告 : Epoch comprised more than `samples_per_epoch` samples,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41789961/
我被这个问题困扰了好几天... 我的问题是,为什么训练时间之间有如此大的差异,以至于我将生成器的batch_size设置为“1”和“20”。 如果将 batch_size 设置为 1 ,则 1个时期的
我有大约 6200 张训练图像,我想使用 keras.preprocessing.image.ImageDataGenerator 类的 flow(X, y) 方法来扩充小图像数据集如下: train
定义每个时期的样本 = 233 和 nb_val_samples = 62 和时期 = 4 然后我得到错误 Type-error: fit_generator() got an unexpected
我创建了一个简单的猫狗图像分类(卷积神经网络)。拥有每类 7,000 个训练数据和每类 5,500 个验证数据。 我的问题是我的系统没有完成所有时期。如果有人可以解释选择 nb_epoch、sampl
我正在使用 Keras 和 Theano 来训练基本的逻辑回归模型。 假设我有一个包含 100 万个条目的训练集,它对于我的系统来说太大了,无法在不耗尽内存的情况下使用标准的 model.fit()。
我在 Jupyter Notebook 中使用 Keras 2.0.8 和 Python 3 内核。我的后端是 TensorFlow 1.3,我在 Mac 上开发。 每当我使用 fit_generat
我是一名优秀的程序员,十分优秀!