image - MNIST 图像是什么图像格式？-6ren

image - MNIST 图像是什么图像格式？

转载作者：行者123 更新时间：2023-11-30 09:50:29

26

4

我已经从 MNIST 训练集中解压了第一张图像，并且可以访问 (28,28) 矩阵。

[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   3  18  18  18 126 136
  175  26 166 255 247 127   0   0   0   0]
 [  0   0   0   0   0   0   0   0  30  36  94 154 170 253 253 253 253 253
  225 172 253 242 195  64   0   0   0   0]
 [  0   0   0   0   0   0   0  49 238 253 253 253 253 253 253 253 253 251
   93  82  82  56  39   0   0   0   0   0]
 [  0   0   0   0   0   0   0  18 219 253 253 253 253 253 198 182 247 241
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  80 156 107 253 253 205  11   0  43 154
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0  14   1 154 253  90   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0 139 253 190   2   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0  11 190 253  70   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  35 241 225 160 108   1
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0  81 240 253 253 119
   25   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  45 186 253 253
  150  27   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  16  93 252
  253 187   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 249
  253 249  64   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  46 130 183 253
  253 207   2   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  39 148 229 253 253 253
  250 182   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0  24 114 221 253 253 253 253 201
   78   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  23  66 213 253 253 253 253 198  81   2
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0  18 171 219 253 253 253 253 195  80   9   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0  55 172 226 253 253 253 253 244 133  11   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0 136 253 253 253 212 135 132  16   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    0   0   0   0   0   0   0   0   0   0]]

我想对其进行一些图像处理，例如转换为灰度然后将其二值化(用于机器学习)，但是我对正在处理的图像格式感到困惑。如果这是一个 (28, 28, 3) ，很明显它是一个具有 3 channel 的 RGB 图像。然而，这是一个 (28, 28) 图像，每个像素的值都在离散范围 [0, 255] 中，这相当奇怪。该图像是否已处于灰度状态，我是否只需标准化像素值？正常化到底意味着什么？我是否要将展平向量乘以标量1/(所有能量值的总和)？

谢谢!

最佳答案

这些图像是具有 8 位量化的 28x28 像素灰度图像(因此范围为 [0-255])。这些图像显然是二值黑白图像，但调整大小期间的抗锯齿导致它们具有额外的灰度值。请参阅here了解更多详细信息。

通常，您可以通过将所有值除以 255(而不是所有像素值的总和)来进行标准化。

关于image - MNIST 图像是什么图像格式？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45826184/

26

4

0

文章推荐： java - 获取选项菜单以显示在系统栏中

文章推荐： javascript - 导出函数不是函数？

文章推荐： javascript - 如何将html元素保存为png

python - 学习 MNIST 后对非 MNIST 图像进行分类
我的机器学习算法已经学习了 MNIST 数据库中的 70000 张图像。我想在 MNIST 数据集中未包含的图像上对其进行测试。但是，我的预测函数无法读取我的测试图像的数组表示。如何在外部图像上测试
python - 制作自己的 MNIST 数据集(与 MNIST 格式相同)
我正在尝试创建我自己的 MNIST 数据版本。我已将训练和测试数据转换为以下文件； test-images-idx3-ubyte.gz test-labels-idx1-ubyte.gz train-
python - 无法在 Windows 上使用 python-mnist 包加载 MNIST 数据
我通过 pip 在我的 Windows 设备上安装了 python-mnist 包，正如 Github 文档中所述，方法是在我的 Anaconda 终端中输入以下命令: pip install pyt
一小时学会TensorFlow2之Fashion Mnist
描述 Fashion Mnist 是一个类似于 Mnist 的图像数据集. 涵盖 10 种类别的 7 万 (6 万训练集 + 1 万测试集) 个不同商品的图片. Tensor
tensorflow - MNIST 识别手写文字
该模型现在只能使用 tf. 识别单个字母。我怎样才能让它识别连续的字母单词？最佳答案手写数字识别。 ... MNIST 是一个广泛用于手写数字分类任务的数据集。它由 70,000 个标记为 28x
image - MNIST 图像是什么图像格式？
我已经从 MNIST 训练集中解压了第一张图像，并且可以访问 (28,28) 矩阵。 [[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0
python - MNIST 数据反规范化不会给我返回相同的结果
这是我学习的一部分。我知道标准化确实有助于提高准确性，因此将 mnist 值除以 255。这会将所有像素除以 255，因此 28*28 的所有像素的值将在 0.0 到 1.0 范围内. 现在我厌倦了将
numpy - MNIST 中每个数字代表什么？
我已成功将 MNIST 数据下载到扩展名为 .npy 的文件中。当我打印第一张图像的几列时。我得到以下结果。这里每个数字代表什么？ a= np.load("training_set.npy") pri
TensorFlow - MNIST 数据中的训练准确性没有提高
我用tensorflow写了一个程序来处理Kaggle的数字识别问题。程序可以正常运行，但训练准确率总是很低，大约10%，如下: step 0, training accuracy 0.11 step
python - MNIST 数据集中的图像是如何转换的？
在 cnn_mnist.py例如，脚本首先加载训练和测试数据，如您从 120 行到 124 行中看到的那样。当我打印 print(train_data.shape) 时，我得到 (55000, 784
python - 神经网络 MNIST
我研究神经网络有一段时间了，用python和numpy做了一个实现。我用 XOR 做了一个非常简单的例子，它运行良好。所以我想我更进一步尝试 MNIST 数据库。这是我的问题。我正在使用具有 784
python - MNIST:试图获得高精度
我目前正在研究手写数字识别问题。首先，我针对 MNIST 数据集测试了示例手写数字。我的准确率为 53%，我需要 90% 以上的准确率。以下是我迄今为止为提高准确性所做的尝试。创建了我自己的数
python - 如何在我自己的数据集图像上测试 mnist
我正在尝试使用我自己的数字图像数据集测试 mnist。我为此写了一个 python 脚本，但它给出了一个错误。错误在代码的第 16 行。实际上我无法发送图像进行测试。给我一些建议。提前致谢。 imp
python - Mnist 数据图像和标签不匹配
我知道这可能是一个愚蠢的问题，但我真的不明白为什么。下面是我尝试从训练数据中打印单个图像和具有相同索引的标签的代码 import matplotlib.pyplot as plt from tenso
python - MNIST 手写数字
我尝试使用以下数据集在 python 中制作一个能够识别手写数字的脚本:http://deeplearning.net/data/mnist/mnist.pkl.gz . 关于这个问题和我试图实现的算
java - MNIST 的缩减图像
我正在尝试解决 Android 设备上的 MNIST 分类问题。我已经有一个经过训练的模型，现在我希望能够识别照片上的单个数字。拍完照片后，我会进行一些预处理，然后再将图像传递给模型。这是原始图像的
由浅入深学习TensorFlow MNIST 数据集
MNIST 数据集介绍 MNIST 包含 0~9 的手写数字, 共有 60000 个训练集和 10000 个测试集. 数据的格式为单通道 28*28 的灰度图. LeNet 模型
python - 为什么导入 mnist 数字数据集时总是漏掉一个子图？
我想导入 mnist digits 数字以在一个图中显示，并编写这样的代码， import keras from keras.datasets import mnist import matplotl
ocr - 去偏斜 MNIST 数据集
我目前正在研究数字手写识别问题。我发现很多state-of-art算法对mnist dateset采用了一些预处理方法，比如deskewing和jittering(我不知道'jittering'是什么
python - 对 MNIST 数据集进行标准化和缩放的正确方法
我到处找，但找不到我想要的。基本上，MNIST 数据集具有像素值在范围 [0, 255] 内的图像。 .人们说，一般来说，最好做到以下几点: 将数据缩放到 [0,1]范围。将数据标准化为具有零均值和

首页

博学

6Ren·AI

商城

image - MNIST 图像是什么图像格式？