gpt4 book ai didi

python - 将 csv 文件转换为机器学习输入的最简单方法是什么?

转载 作者:行者123 更新时间:2023-11-30 09:34:05 25 4
gpt4 key购买 nike

我知道你可以做这样的事情:

import pandas as pd
df = pd.read_csv('mushrooms.csv')
df.apply(lambda x: pd.factorize(x)[0])

但我想要的是将所有类别更改为 01

例如,如果 CSV 文件中的 header 为 favColorfavCookie,并且 favColor 的选项为“red”, 'orange' 和 'green',favCookie 的选项是 'chocolate' 和 'sugar'。如果其中一行是“红色”和“糖”,我希望整行更改为 [1,0,0,0,1]

我一直在寻找像库这样的东西,所以每次我使用 CSV 文件和神经网络时都会很容易做到这一点

最佳答案

pandas ,你可以使用pandas.get_dummies() :

new_df = pd.get_dummies(df)

如果您想使用scikit-learn ,您可以使用OneHotEncoder :

from sklearn.preprocessing import OneHotEncoder

new_np_array = OneHotEncoder().fit_transform(df.values)

正如我用变量名称所示的那样,get_dummies()返回 pandas数据框,而 OneHotEncoder返回 numpy数组

关于python - 将 csv 文件转换为机器学习输入的最简单方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48045708/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com