gpt4 book ai didi

python-3.x - 这段代码是什么意思? (训练测试拆分 Scikit Learn)

转载 作者:行者123 更新时间:2023-11-30 08:50:51 25 4
gpt4 key购买 nike

无论我走到哪里,我都会看到这段代码。需要帮助理解这一点。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,testsize = 0.20)

X_train、X_test、y_train、y_test 在这种情况下意味着什么,我应该将其放入 fit() 和 Predict()

最佳答案

正如文档所述,train_test_split 的作用是:将数组或矩阵拆分为随机训练和测试子集。您可以在这里找到它:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html 。我相信正确的关键字参数是 test_size 而不是 testsize 并且它表示要包含在测试分割中的数据集的比例(如果它是 float 的)或测试样本的绝对数量(如果是 int)。X 和 y 是具有相同长度/形状 [0] 的可索引序列,因此基本上是要拆分的数组/列表/矩阵/数据帧。

总而言之,代码将 X 和 y 拆分为随机训练和测试子集(X 为 X_train 和 X_test,y 为 y_train 和 y_test)。每个测试子集应包含原始数组条目的 20% 作为测试样本。您应该将 _train 子集传递给 fit(),将 _test 子集传递给 predict()。希望对您有帮助~

关于python-3.x - 这段代码是什么意思? (训练测试拆分 Scikit Learn),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57724175/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com