作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我刚刚开始使用 Weka,当我的决策树太深时我无法理解。我有一组 423 个特征,据我所知,这些特征是为每个目标随机选择的。因此,这些特征子集生成带有决策叶的分支或流程,这些决策叶似乎不通用,实际上它们太具体了,因为它们仅适用于语料库中所有案例中的一两个案例,例如,否(2/0 ),是(1/0)。我认为它不能很好地概括,也许这是因为决策树太深了。所以我的问题是,树的 maxDepth 应该是多少?我如何知道树何时太深?我尝试将 maxDepth 更改为 10,但叶子仍然包含基于少数情况的决策。另外,默认情况下 Weka 生成 10 棵树,我想知道设置更多的树是否会给我带来更好的结果。我读过随机森林适用于 100,300 甚至 500 棵树,但我不知道这是否适用于一组 423 个特征。最后,我想知道这个决定中的“1”意味着什么:“否(632/1)”。这是否意味着 632 个被正确分类为“否”,但有一个虽然是“否”却被分类为"is"? “1”是误报吗?感谢您的帮助!
最佳答案
在这种情况下,最好尝试的是对参数进行网格搜索。因此,您可以决定性能指标并找出不同参数的值。这将有利于确定最佳参数设置。还尝试在验证集而不是训练集上计算性能指标。
关于tree - WEKA - RandomForest 如何知道树何时太深?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27429715/
我是一名优秀的程序员,十分优秀!