gpt4 book ai didi

python - 随机森林的表现比其他方法好得多

转载 作者:行者123 更新时间:2023-11-30 08:34:35 26 4
gpt4 key购买 nike

在评估 SVM、RF 和 DT(最大深度 = 3)的性能时,我使用 RF 模型获得了非常出色的结果。建模的数据是真实世界的数据。由于数据集不平衡,它们都使用分层交叉验证进行评估。

对于之前看到的 4 个不同类别,我得到了准确率、召回率和 F1 的分数。

最初,数据集包含以下 4 个类的 value_counts:

  1. 喂食故障 -(P-设定/P-实际差异):4 098 个数据样本
  2. 喂食故障-(喂食安全电路故障):383个数据样本
  3. 发电机加热:228 668 个数据样本
  4. 其他:51 966 851 个样本

RF 为何比 SVM 和 DT 好这么多?

提前致谢!

enter image description here

enter image description here

最佳答案

这些结果完全合理!随机森林是一种比决策树更强大的算法,因为它基本上是 DT 的集合。当涉及到未见过的数据的泛化时,集成(更多模型的组合)在机器学习中的功能非常强大。在决策树或 SVM 过度拟合的情况下,随机森林通常表现相对较好,因为在内部,许多看到所有不同特征集的 DT 正在对结果进行投票。

关于python - 随机森林的表现比其他方法好得多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58957493/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com