gpt4 book ai didi

python - 如何在 X_train、y_train、X_test、y_test 中分割图像数据集?

转载 作者:行者123 更新时间:2023-12-02 03:22:38 26 4
gpt4 key购买 nike

我有一个如下结构的数据集:

Dataset/
|
|
-----Pothole/
| |
| ------ umm001.jpg
| |
| ------ abd.jpg
| |
| ------
| |
|
|
----Road/
|
------road005.jpg
|
------ummm.jpg
|
------
|

我想将此数据集拆分为 X_train、y_train、X_test、y_test

这样:

### data: shuffled and split between train and test
(X_train, y_train), (X_test, y_test) = mnist.load_data()

或者,

(X_train, y_train), (X_test, y_test) = train_test_split(X,y, test_size=0.20)

我该怎么做?

最佳答案

您可以使用 os 模块构建 Xy 数组:

import os

X = []
y = []
base_dir = '<full path to dataset folder>/'
for f in sorted(os.listdir(base_dir)):
if os.path.isdir(base_dir+f):
print(f"{f} is a target class")
for i in sorted(os.listdir(base_dir+f)):
print(f"{i} is an input image path")
X.append(base_dir+f+'/'+i)
y.append(f)
print(X)
print(y)

然后您可以使用 train_test_split(X,y, test_size=0.20) 来获取您需要的内容,但请记住,您必须使用其他库(例如 pillow)打开图像scikit-image 或类似的。

如果您打算使用pytorch来训练神经网络,您可以使用他们的ImageFolder class创建您的数据集。

关于python - 如何在 X_train、y_train、X_test、y_test 中分割图像数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54333202/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com