gpt4 book ai didi

image - 如何从头开始创建和格式化图像数据集以用于机器学习?

转载 作者:行者123 更新时间:2023-11-30 09:37:52 27 4
gpt4 key购买 nike

我只使用过 .csv 格式的机器学习。我也使用过图像格式,但仅限于预制图像集(MNIST 等)。如果我要从头开始创建图像集,类标签通常是如何格式化的?我需要手动为 jpeg 图像添加标题吗?

最好,杰里米

最佳答案

我使用过的图像数据集格式如下:

  1. 类名作为文件夹:顾名思义,属于特定类的图像将填充到特定文件夹中,文件夹名称代表该类。

例如,用于对猫与狗进行分类的数据集

-Dataset/
--Cats/
---all cat images here
--Dogs/
---all dogs images here
  • 单个文件夹+文本文件:所有图像都转储到单个文件夹中 - 显然每个图像文件都有一个唯一的名称。 image_name : class 的键值对可以作为行存储在 csv 文件中。
  • 例如

    -Dataset/
    --all images heree
    --imagename_class.csv
  • 文件名中包含类的单个文件夹:所有图像都可以放置在一个文件夹中,该文件夹的图像名称具有类标签和一些变化的索引值。
  • 例如

    -Dataset/
    --cat_1.jpg
    --cat_2.jpg
    --dog_1.jpg
    --cat_3.jpg
    --...

    希望这有帮助!

    关于image - 如何从头开始创建和格式化图像数据集以用于机器学习?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29323592/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com