gpt4 book ai didi

python - 随机森林 - 使空值在决策树中始终有自己的分支

转载 作者:行者123 更新时间:2023-12-05 06:22:41 26 4
gpt4 key购买 nike

您好,我正在使用随机森林构建模型,我正在尝试处理空值。有没有人碰巧知道如何强制随机森林模型将空值视为它自己的独立带? (因为空值永远不会与其他值范围结合在一起。因此在决策树中,度量的空值总是有自己的分支)。

我不想使用均值而不是空值,因为我不希望模型将空值与其他接近均值的值结合起来,我也不想删除空值。

我希望决策树始终将度量的空值视为它自己的分支。

谢谢:)

最佳答案

你可以试试这些。

  1. 将空值替换为与列中任何其他值差异很大的值。

示例

让“feature”成为只有正值的列的名称,那么负值应该足以作为 null。

dataframe.loc[dataframe['feature'].isna(), 'feature'] = -100
  1. 您可以添加一个新的空值跟踪列来跟踪另一列的空值。 (如果考虑了所有特征来对随机森林建模,则使用此选项)

示例

让'feature'成为具有空值的列的名称

dataframe['feature_isnull'] = 0 #null-tracking column
dataframe.loc[dataframe['feature'].isna(),'feature_isnull'] = 1

关于python - 随机森林 - 使空值在决策树中始终有自己的分支,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58971596/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com