- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我看过一些教程,以深入了解 Keras,以使用卷积神经网络进行深度学习。在教程(以及 Keras 的官方文档)中,MNIST 数据集是这样加载的:
from keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
但是,没有解释为什么我们有两个数据元组。我的问题是:什么是 x_train
和 y_train
以及它们与它们的 x_test
和 y_test
有何不同同行?
最佳答案
训练集是用于训练模型的数据集的子集。
x_train
是训练数据集。 y_train
是 x_train
中所有数据的标签集。测试集是您在模型通过验证集的初始审查后用于测试模型的数据集的子集。
x_test
为测试数据集。y_test
是 x_test
中所有数据的标签集。验证集是您用来调整超参数的数据集(与训练集分开)的子集。
我做了一个 Deep Learning with Keras playlist在YouTube上。它包含 Keras 入门的基础知识,以及几个视频演示如何将图像组织成训练/有效/测试集,以及如何让 Keras 为您创建验证集。看到这个实现可能会帮助您更深入地了解这些不同的数据集在实践中是如何使用的。
关于python - Keras 中的 x_train 和 x_test 有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46495215/
我已经构建了一个神经网络,它在大约 300,000 行、2 个分类变量和 1 个自变量的小型数据集上运行良好,但当我将其增加到 650 万行时遇到内存错误。所以我决定修改代码并越来越接近,但现在我遇到
Y_预测= [ 1.22770607 -0.04569864 2.23941551 1.35143415 1.28991445 0.01398049 1.05511961 1.84491
对于某些问题,验证数据不能是生成器,例如:TensorBoard histograms : If printing histograms, validation_data must be provid
我有一个 pandas 数据框,用于二元分类案例(类别 A 和类别 B)。为了获得 X_train、X_test、y_train、y_test,我按 70:30 拆分,如下所示: from sklea
我有一个如下结构的数据集: Dataset/ | | -----Pothole/ | | | ------ umm001.jpg |
我有一个如下结构的数据集: Dataset/ | | -----Pothole/ | | | ------ umm001.jpg |
我在使用 keras sequential().predict(x_test) 时遇到问题。 顺便说一句,使用 sequential().predict_proba(x_test) 获得相同的输出,因
我看过一些教程,以深入了解 Keras,以使用卷积神经网络进行深度学习。在教程(以及 Keras 的官方文档)中,MNIST 数据集是这样加载的: from keras.datasets import
世界各地的程序员们大家好。我在将数据输入机器学习模型时遇到问题。 我尝试使用 pandas 将 CSV 文件读入 python,然后将其拆分为训练数据和测试数据。之后,我使用 StandardScal
如果我有一个数据集 dataset = tf.keras.preprocessing.image_dataset_from_directory( directory, labels="
所以我想在拆分它们(使用分层)后对训练和测试数据集执行平均目标编码,并且为了这样做,必须将它们重新合并在一起。 我该怎么做? ,任何建议将不胜感激? , 谢谢你。 X_train, X_test
我是一名优秀的程序员,十分优秀!