gpt4 book ai didi

machine-learning - Weka 用于评估连续值熵的 InfoGainAttributeEval 公式是什么?

转载 作者:行者123 更新时间:2023-11-30 08:47:03 25 4
gpt4 key购买 nike

我正在使用 Weka 的属性选择函数来获取信息增益,并试图找出 Weka 在处理连续数据时使用的具体公式。

我知道熵的常用公式是 this当数据中的值是离散的时。据我所知,在处理连续数据时,可以使用微分熵或离散化值。我尝试查看Weka对InfoGainAttributeEval的解释并浏览了很多其他引用资料,但找不到任何东西。

也许只有我这么想,但是有人知道Weka是如何实现这个案例的吗?

谢谢!

最佳答案

我问了作者 Mark Hall,他说:

It uses the supervised MDL-based discretization method of Fayad and Irani. See the javadocs:
http://weka.sourceforge.net/doc.stable-3-8/weka/attributeSelection/InfoGainAttributeEval.html

您还可以看到离散化方法的链接:

http://weka.sourceforge.net/doc.stable-3-8/weka/filters/supervised/attribute/Discretize.html

关于machine-learning - Weka 用于评估连续值熵的 InfoGainAttributeEval 公式是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35665329/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com