gpt4 book ai didi

python - Pandas.get_dummies 返回两列(_Y 和 _N)而不是一列

转载 作者:太空宇宙 更新时间:2023-11-03 11:38:25 24 4
gpt4 key购买 nike

我正在尝试使用 sklearn 根据我的数据集训练决策树。

当我尝试将数据切片为(结果:Y,预测变量:X)时,结果(我的标签)在 True/False:

#data slicing 
X = df.values[:,3:27] #X are the sets of predicting variable, dropping unique_id and student name here
Y = df.values[:,'OffTask'] #Y is our predicted value (outcome), it is in the 3rd column

我是这样做的,但我不知道这是否是正确的做法:

#convert the label "OffTask" to dummy 

df1 = pd.get_dummies(df,columns=["OffTask"])
df1

我的问题是数据集 df1 将我的标签 Offtask 返回到 OffTask_NOffTask_Y

有人知道怎么解决吗?

最佳答案

get_dummies 用于将标称字符串值转换为整数。它返回与列中可用的唯一字符串值一样多的列,例如:

df={'color':['red','green','blue'],'price':[1200,3000,2500]}
my_df=pd.DataFrame(df)
pd.get_dummies(my_df)

在您的情况下,您可以删除第一个值,任何值为 null 的地方都可以被认为是第一个值

关于python - Pandas.get_dummies 返回两列(_Y 和 _N)而不是一列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54639614/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com