artificial-intelligence - Quinlan的C4.5算法中如何计算数值属性的阈值？-6ren

artificial-intelligence - Quinlan的C4.5算法中如何计算数值属性的阈值？

转载作者：行者123 更新时间：2023-12-04 18:45:06

25

4

我试图找出 C4.5 算法如何确定数字属性的阈值。我已经研究过但无法理解，在大多数地方我都找到了以下信息:

The training samples are first sorted on the values of the attribute Y being considered. There are only a finite number of these values, so let us denote them in sorted order as {v1,v2, …,vm}. Any threshold value lying between vi and vi+1 will have the same effect of dividing the cases into those whose value of the attribute Y lies in {v1, v2, …, vi} and those whose value is in {vi+1, vi+2, …, vm}. There are thus only m-1 possible splits on Y, all of which should be examined systematically to obtain an optimal split.

It is usual to choose the midpoint of each interval: (vi +vi+1)/2 as the representative threshold. C4.5 chooses as the threshold a smaller value vi for every interval {vi, vi+1}, rather than the midpoint itself.

我正在研究 Play/Dont Play ( value table ) 的示例，不明白当状态为晴天时，您如何获得属性湿度的数字 75 ( tree generated ) 因为湿度值到晴天状态是 {70,85,90,95}。

有人知道吗？

最佳答案

正如您生成的树图像所暗示的那样，您可以按顺序考虑属性。您的 75 示例属于 Outlook = 阳光分支。如果您根据 Outlook = 晴天过滤数据，则会得到下表。

outlook temperature humidity    windy   play
sunny   69           70         FALSE   yes
sunny   75           70         TRUE    yes
sunny   85           85         FALSE   no
sunny   80           90         TRUE    no
sunny   72           95         FALSE   no

如您所见，此条件下的湿度阈值为“< 75”。

j4.8 是 ID3 algorithm 的后继者.它使用信息增益和熵来决定最佳分割。根据维基百科

The attribute with the smallest entropy 
is used to split the set on this iteration. 
The higher the entropy, 
the higher the potential to improve the classification here.

关于artificial-intelligence - Quinlan的C4.5算法中如何计算数值属性的阈值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16097189/

25

4

0

文章推荐： three.js - three.js中奇特的工件和挤压形状中的空纹理

文章推荐： variables - CMake 使用 "@"与 "${}"进行变量扩展

r - 将长向量中的元素剪裁到 +/- 阈值
我正在用 R 编写程序。我卡在这里。我有像这样的矢量 X=c(84.05, 108.04, 13.95, -194.05, 64.03, 208.05, 84.13, 57.04) 我想在用 180
Android ACTION_MOVE 阈值
我正在编写一个应用程序，该应用程序涉及使用手指或手写笔在屏幕上书写。我有那部分工作。在 ACTION_DOWN 上，开始绘制；在 ACTION_MOVE 上，添加线段；在 ACTION_UP 上，完成
python - 如何在opencv(阈值)中改变轮廓形成的区域
我正在尝试构建 OCR 以从图像中提取文本，我正在使用轮廓来形成文本字符的边界，经过几次更改 cv2.threshold 的试验后，我在形成文本字符的边界时得到了最适合的轮廓。 #files = o
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold函数(更具体 THRESH_OTSU )，只是我想用蒙版(任何形状)来做，以便在计算过程中忽略外部(背景)。图像是单 channel (必
python - 适应不同闪电条件的 OpenCV 阈值
对于学校项目，我试图用 Python 编写一个程序来跟踪学生的运动。为了做到这一点，我正在使用 OpenCV。在互联网上查找了一些教程后，我注意到几乎每个人都使用阈值来实现这一点，因为几乎每一步都需
jestjs - 测试报告为缓慢的开 Jest 阈值
我使用 jest 来驱动 selenium 测试，它报告一个需要 12 秒的测试缓慢(持续时间以红色突出显示)。在这种情况下，12 秒就可以了。如何将阈值配置为 30 秒？最佳答案 Jest is
python - 基于特定距离(阈值)的两个列表的交集
我想找到 list1 中与 list2 中的值足够接近的值(基于指定的阈值)，即与下面的代码类似的功能。然而，与 pyhton 的 set 交集相比，下面的 intersect_with_thresh
具有多个系列的 Jquery flot 阈值
我正在尝试创建一张图表上有两个系列并带有阈值选项的浮线图。我知道当我只有 1 个系列时如何启用阈值(就像这里 http://people.iola.dk/olau/flot/examples/thre
javascript - 获取计算的直方图 bin 阈值
我已正确应用 d3 (v 4.0) 直方图函数对数据数组进行分箱。我的代码如下所示: var bins = d3.histogram() .domain([data_points_min,
Mysql 全文 50% 阈值
我正在使用带有自然语言全文的 Mysql FULLTEXT 搜索，不幸的是，我遇到了 FULLTEXT 50% 阈值，如果给定的关键字出现在总行数的 50% 时间，则不允许我搜索行。我搜索并找到了一
Javascript math.round 阈值
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
动态数据值的 JavaScript float 阈值
这是我的绘图数据 var data = [{ data: [[4, 80], [8, 50], [9, 130]], color: "r
opencv - 什么是 Canny 阈值？
是否可以制作Canny忽略短边还是忽略低梯度边？在我的例子中，我将卡片放在木头上，并在 canny 之后看到木结构的许多边缘 canny 函数中的两个阈值有什么用？最佳答案 Large intens
c++ - 带掩码的 OpenCV 阈值
我正在尝试使用 OpenCV 的 cv::threshold 函数(更具体的 THRESH_OTSU)，只是我想使用掩码(任何形状) ), 以便在计算过程中忽略外部(背景)。图像是单 channel
audio - 根据音频(阈值、频率)缩放图像
我正在寻找根据提供的音频、频率范围(例如 20hz-1000hz)和阈值缩放 PNG 文件，以获得平滑的效果。例如，当有脚踢时，比例平滑到 120%，我想让那些音频可视化器，如 dubstep 等.
scala - Spark mllib f1score 阈值
我正在尝试找到最佳阈值，以使我的逻辑回归具有最高的 f1 分数。但是，当我写下以下几行时: val f1Score = metrics.fMeasureByThreshold f1Score.fore
javascript - x 轴上的 float 阈值
我使用 Flot 创建了一个实时(每 10 毫秒更新一次)垂直样条图。图表可见here on Codepen 。我包括了 Flot multiple threshold plugin ，但我希望阈值使
python - Pandas dataframe 阈值——如果超过则保持数字固定
我有一个数据框，其中包含从第 1 天到第 7 天的三个人(John、Terry、Henry)的分数。 1 2 3 4 5 6 7
opencv - 多级 (4) Otsu 阈值
我正在尝试实现多级 Otsu 阈值，更具体地说，我需要 3 个阈值/4 个类。我知道关于 SO 的 2 个类似问题:#34856019 和 #22706742。问题是我没有得到好的结果:我已经阅读了
python - opencv 阈值 THRESH_BINARY 对彩色图像有何作用？
The documentation在 THRESH_BINARY 上说: dst(x,y) = maxval if src(x,y) > thresh else 0 这对我来说并不意味着这不适用于彩色

首页

博学

6Ren·AI

商城

artificial-intelligence - Quinlan的C4.5算法中如何计算数值属性的阈值？