gpt4 book ai didi

algorithm - weka 中有哪些算法可以自动对数据集的特征进行加权?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:35:08 25 4
gpt4 key购买 nike

我有一个包含 5 到 10 个特征的数据集。输出值是一个标量值。 (所以我看起来有点像线性回归,而不是分类器)。有些特征比其他特征更重要,并且某些特征的组合可以产生很大的结果。

考虑到这些要求,Weka 中构建的哪些算法是很好的候选者?

最佳答案

您是否尝试过 Weka Explorer 中的“选择属性”选项卡?InfoGainAttributeEval 和 CorrelationAtrributeEval 是我通常使用的两种有用的特征选择方法。

这是 InfoGainAttributeEval 针对我的数据集的示例输出。第一列按降序列出了每个属性的重要性。

Ranked attributes:
0.02416 8 attr8
0.014166 16 attr16
0.012868 14 attr14
0.011905 15 attr15
0.011624 6 attr6
0.010619 1 attr1
0.010367 3 attr3
0.010171 5 attr5
0.008921 7 attr7
0.008763 11 attr11
0.006094 9 attr9
0.00603 10 attr10
0.003089 4 attr4
0.00095 12 attr12
0.000672 2 attr2
0.000127 13 attr13

Selected attributes: 8,16,14,15,6,1,3,5,7,11,9,10,4,12,2,13 : 16

如果你有兴趣,请引用下面链接中有关基于相关性的特征选择的经典论文: http://www.cs.waikato.ac.nz/~mhall/thesis.pdf

关于algorithm - weka 中有哪些算法可以自动对数据集的特征进行加权?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12983734/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com