gpt4 book ai didi

python - 将 Pandas Dataframe 转换为 sklearn 的 numpy

转载 作者:太空狗 更新时间:2023-10-30 02:03:41 27 4
gpt4 key购买 nike

我是 python 和 sklearn 的新手。我有一个泰坦尼克号数据集的 Pandas 数据框。我希望它用于 sklearn 逻辑预测。

我尝试了以下方法

data_np = data.astype(np.int32).values

但是不工作。我想利用数据集中的不同特征,如“Pclass”、“Age”、“Sex”等......

我想将整个数据以及单列数据 ["Age"] 转换为 sklearn numpy 格式。任何帮助。

最佳答案

'Sex' 和 'Embarked' 等分类变量需要单热编码才能在 LogisticRegression 模型中使用它们。对于 pandas,您可以使用 get_dummies(data['Sex'])

这里有一个完整的教程,专门介绍了同一数据集上的这个问题:

http://nbviewer.ipython.org/github/ogrisel/parallel_ml_tutorial/blob/master/rendered_notebooks/04%20-%20Pandas%20and%20Heterogeneous%20Data%20Modeling.ipynb

关于python - 将 Pandas Dataframe 转换为 sklearn 的 numpy,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29512130/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com