gpt4 book ai didi

machine-learning - scikit learn train_test_split 函数未按预期工作

转载 作者:行者123 更新时间:2023-11-30 09:44:58 26 4
gpt4 key购买 nike

我正在使用训练测试分割函数来分离训练和测试数据,但函数为分离的训练测试数据分配了错误的标签。它不是从预期行分配标签,而是从预期行的第二行分配标签。请让我知道我哪里出错了?

data = pd.read_csv('To_Tanaji.csv')
print(data.columns)
print(data.shape)
#plt.hist(train["DiffCorrectLatRawLat"])
#test = pd.read_csv('test.csv')

#np.polyfit(data['DistanceRaw2GPS'], data['DistanceCorrected2GPS'], 2)
Output= data.DistanceCorrected2GPS
Input=data.DistanceRaw2GPS

X_train, X_test, y_train, y_test = train_test_split(Input, Output, test_size=0.2)

最佳答案

我不建议关闭 train_test_split 函数中的 shuffle 参数,而是保持固定 random_state 变量以实现可重现的分割。最好是随机拆分,而不是拆分数据集的前 20%,这可能会导致数据出现偏差。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(Input, Output, test_size = 0.20, random_state = 0)

如果分割标签错误,您应该确保输出和输入变量分配正确或不正确。

关于machine-learning - scikit learn train_test_split 函数未按预期工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53634882/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com