gpt4 book ai didi

python - 在随机森林中使用 "one hot"编码的因变量

转载 作者:太空宇宙 更新时间:2023-11-04 06:40:30 25 4
gpt4 key购买 nike

我正在使用 sklearn-learn 在 python 中构建一个随机森林,并且我已经对所有分类变量应用了“one hot”编码。问题:如果我对我的 DV 使用“one hot”,我应该将其所有虚拟列应用为 DV,还是应该以不同方式处理 DV?

最佳答案

您需要对所有值不是数字的列应用单热编码。您可以使用单热和其他非数字列处理 DV 以及一些其他编码。例如:假设有一个城市名称的列,你需要把它变成数字形式。这称为数据成型。您也可以在没有一次性的情况下进行这种成型。

例如:糖尿病的 DV 列包含条目"is"和“否”。这没有单热编码。

diabetes_map = {True : 1, False : 0}
df['diabetes'] = df['diabetes'].map(diabetes_map)

关于python - 在随机森林中使用 "one hot"编码的因变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53589993/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com