gpt4 book ai didi

scikit-learn - train_test_split 函数是否保持类之间的平衡

转载 作者:行者123 更新时间:2023-12-05 01:41:20 24 4
gpt4 key购买 nike

我有一个问题,我一直在寻找答案,但找不到答案。

如果我有一个使用三个或更多类标记的数据集,其中每个类代表 33% 的数据。当我拆分数据时,训练/验证/测试集是否在类之间保持相同的平衡?

如果没有,有办法保持平衡吗?

提前致谢。

最佳答案

找到了!

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

关于scikit-learn - train_test_split 函数是否保持类之间的平衡,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54600907/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com