gpt4 book ai didi

machine-learning - 如何处理C4.5(J48)决策树中缺失的属性值?

转载 作者:行者123 更新时间:2023-11-30 08:26:18 26 4
gpt4 key购买 nike

使用 Weka 的 C4.5 (J48) 决策树处理缺失要素属性值的最佳方法是什么?训练和分类过程中都会出现缺失值的问题。

  1. 如果训练实例中缺少值,我是否正确假设放置了“?”该功能的值(value)?

  2. 假设我能够成功构建决策树,然后根据 Weka 的树结构用 C++ 或 Java 创建我自己的树代码。在分类期间,如果我尝试对新实例进行分类,我应该为具有缺失值的特征赋予什么值?如何使树下降经过具有未知值的决策节点?

使用朴素贝叶斯处理缺失值会更好吗?我只会为它们分配一个非常小的非零概率,对吗?

最佳答案

摘自 Pedro Domingos 在华盛顿大学的 ML 类(class):

以下是 Pedro 针对 A 缺失值建议的三种方法:

  • 分配排序到节点 n 的其他示例中 A 的最常见值
  • 在具有相同目标值的其他示例中分配 A 最常见的值
  • 将概率p_i分配给A的每个可能值v_i;将示例的分数 p_i 分配给树中的每个后代。

现在可以在here查看幻灯片和视频。

关于machine-learning - 如何处理C4.5(J48)决策树中缺失的属性值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13425722/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com