gpt4 book ai didi

machine-learning - 为什么我们在 train_test_split 的两个数组中都包含目标类?

转载 作者:行者123 更新时间:2023-11-30 09:03:01 25 4
gpt4 key购买 nike

X_train, test_df, y_train, y_test = train_test_split(result, y_true, stratify = y_true, test_size = 0.2)

在上面的 train_test_split 使用示例中,result 是数据帧,y_true 是由数据帧的目标类列形成的 numpy 数组。

我的问题是,如果我们已经单独给出了“y_true”,为什么还要将整个“结果”数据框作为 train_test_split 中的输入参数之一?我的意思是,我们不应该首先从“结果”数据框中排除目标类列吗?

最佳答案

Scikit-learn 有 pandas 支持,但 pandas 不是必需的。对于 numpy 数组,将特征和标签放在同一个数组中并不总是有意义,因此是 train_test_split 函数的当前设计。因此,您需要确保您的 结果 DataFrame 及其拆分具有您想要的格式。如果 y_trueresult DataFrame 的一部分,您可以(并且应该)选择在函数调用之前或之后将其排除。

关于machine-learning - 为什么我们在 train_test_split 的两个数组中都包含目标类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59522613/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com