gpt4 book ai didi

machine-learning - Java 中回归的机器学习特征排名/评分

转载 作者:行者123 更新时间:2023-11-30 09:55:08 25 4
gpt4 key购买 nike

Java 中是否有任何特征评分方法可用于回归数据集,其中类值是连续数字而不是二进制?

ML-Lib feature scoring似乎仅适用于分类数据集。

最佳答案

这很大程度上取决于您的回归算法。基于内核的回归算法的良好功能对于线性分类器可能非常糟糕。(https://en.wikipedia.org/wiki/Feature_selection)您似乎瞄准了“过滤方法”。在许多回归设置中效果很好的是 PIL 逊相关性。这在 ML-Lib 中也可用。

但是,您应该考虑不添加 K 个最相关的特征,但是

  1. 避免选择高度相关的特征对。因此,您必须构建所有特征对之间的相关矩阵。
  2. 选择顶级特征,构建回归模型,测量模型的误差,测量误差与其余特征之间的相关性。这将贪婪地选择最好的特征
  3. 选择功能后,您应该考虑进行敏感性分析。也就是说,为所有特征以及已删除一个特征的所有特征集构建回归模型。如果删除不会产生重大影响,您可以将其删除。

关于machine-learning - Java 中回归的机器学习特征排名/评分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34409356/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com