gpt4 book ai didi

python - 如何拆分数据集以在 Python 中进行训练、测试和验证?

转载 作者:行者123 更新时间:2023-12-04 11:58:58 25 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





How to split data into 3 sets (train, validation and test)?

(9 个回答)



Get a training set on pandas [duplicate]

(4 个回答)



How to split data into 3 parts, one of which wont be used? [duplicate]

(2 个回答)


去年关闭。




我有一个这样的数据集

my_data= [['Manchester', '23', '80', 'CM',
'Manchester', '22', '79', 'RM',
'Manchester', '19', '76', 'LB'],
['Benfica', '26', '77', 'CF',
'Benfica', '22', '74', 'CDM',
'Benfica', '17', '70', 'RB'],
['Dortmund', '24', '75', 'CM',
'Dortmund', '18', '74', 'AM',
'Dortmund', '16', '69', 'LM']
]
我知道使用 sklearn.cross_validation 中的 train_test_split,我已经尝试过
from sklearn.model_selection import train_test_split
train, test = train_test_split(my_data, test_size = 0.2)
结果只是分成测试和训练。我想用随机数据将它分成 3 个单独的集合。
预期的:
测试、训练、有效

最佳答案

您可以简单地使用 train_test split 两次

X_train, X_test, y_train, y_test 
= train_test_split(X, y, test_size=0.2, random_state=1)

X_train, X_val, y_train, y_val
= train_test_split(X_train, y_train, test_size=0.25, random_state=1)
此外,答案可以在 here 中找到

关于python - 如何拆分数据集以在 Python 中进行训练、测试和验证?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64004193/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com