gpt4 book ai didi

tensorflow - 如何找到 Imagenet 数据标签?

转载 作者:行者123 更新时间:2023-12-02 12:17:59 28 4
gpt4 key购买 nike

我有两个关于如何加载 Imagenet 数据的问题。我下载了ILSVRC2012验证集(因为训练集太大)但我有两个问题。

  1. 我不明白如何找到标签。只有文件名类似于“ILSVRC2012_val_00000001.JPEG”的 jpeg 文件,但没有标签。我怎样才能找到他们?

  2. 据我所知,Imagenet 使用 224 * 224 像素图像,问题只是“分类”而不是“检测”,但 ILSVRC2012 集有更多且不同的像素大小。那么,如何获得 224 * 224 像素的正确框呢?

最佳答案

  1. 您将下载三个 tar 存档:一个用于训练数据,一个用于验证数据,一个用于测试数据。

    训练数据包含在 1000 个文件夹中,每个类一个文件夹(每个文件夹应包含 1,300 个 JPEG 图像)。验证数据是一个包含 50k JPEG 图像的文件夹,在其中查找相应的 ILSVRC2012_validation_ground_truth.txt 文件(正如 darren1231 提到的,它需要作为一部分单独下载DevKit)。

测试数据与验证数据类似,但它没有标签(不会向您提供标签,因为您需要向它们提交预测标签,作为竞赛的一部分)。

  • ImageNet 图像具有可变分辨率,平均为 482x415,这取决于您想要如何处理它们来训练模型。大多数人的处理方式如下:首先缩小每个图像的尺寸,使其短边为 256 像素。然后随机裁剪一个 224x224 的补丁。使用这些补丁进行训练(每个时期你都会得到不同的裁剪)。在测试过程中,执行相同的操作,但提取中心 224x224 补丁,并使用它来评估分类准确性。有些人还使用多个补丁进行测试。同样,这取决于您,如果您愿意,可以使用更高的分辨率。
  • 关于tensorflow - 如何找到 Imagenet 数据标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40744700/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com