gpt4 book ai didi

python - 使用 Pandas 为 Scikit-Learn 准备 CSV 文件数据?

转载 作者:太空狗 更新时间:2023-10-29 22:15:22 26 4
gpt4 key购买 nike

我有一个没有标题的 csv 文件,我正在使用 pandas 将其导入 python。最后一列是目标类,其余列是图像的像素值。我如何继续使用 pandas (80/20) 将此数据集拆分为训练集和测试集?

此外,一旦完成,我将如何拆分这些集合中的每一个,以便我可以定义 x(除最后一列之外的所有列)和 y(最后一列)?

我使用以下方法导入了我的文件:

dataset = pd.read_csv('example.csv', header=None, sep=',')

谢谢

最佳答案

我建议使用 sklearn 的 train_test_split

from sklearn.model_selection import train_test_split
# for older versions import from sklearn.cross_validation
# from sklearn.cross_validation import train_test_split
X, y = dataset.iloc[:, :-1], dataset.iloc[:, -1]
kwargs = dict(test_size=0.2, random_state=1)
X_train, X_test, y_train, y_test = train_test_split(X, y, **kwargs)

关于python - 使用 Pandas 为 Scikit-Learn 准备 CSV 文件数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36256708/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com