gpt4 book ai didi

python - 将数据拉入 pandas 数据框架以进行机器学习的正确且最有效的方法

转载 作者:行者123 更新时间:2023-11-30 08:54:51 25 4
gpt4 key购买 nike

给定一个数据框如下

x1 x2 x3 x4 x5 x6 y
2 3 4 5 5 7 11.32
3 4 5 3 2 3 10.99

输入更多数据,例如 1000 行。

将这些数据读入正确的 X、y 分割的最高效且有效的方法是什么?

谢谢,J。

最佳答案

因此,您需要从最后一列中提取值,并从所有其他列中提取特征。您可以使用 iloc具有整数索引和 values为此:

y = df.iloc[:, -1].values
X = df.iloc[:, :-1].values

举个例子:

In [153]: X
Out[153]:
array([[2, 3, 4, 5, 5, 7],
[3, 4, 5, 3, 2, 3]], dtype=int64)

In [154]: y
Out[154]: array([ 11.32, 10.99])

通常对于 scikit-learn 方法,您可以传递数据帧和系列,因此您可以省略 values 属性:

y = df.iloc[:, -1]
X = df.iloc[:, :-1]

In [156]: X
Out[156]:
x1 x2 x3 x4 x5 x6
0 2 3 4 5 5 7
1 3 4 5 3 2 3

In [157]: y
Out[157]:
0 11.32
1 10.99
Name: y, dtype: float64

关于python - 将数据拉入 pandas 数据框架以进行机器学习的正确且最有效的方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35500982/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com