- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图了解有关 CART 算法的更多信息,特别是分类变量考虑了多少个分割。
和
http://www.stat.wisc.edu/~loh/treeprogs/guide/wires11.pdf
他们都指出,对于分类变量,CART 将考虑 2^m-1 -1 分割。
特别是在第二篇论文中,Loh 教授强调,对于包含 31 个离散值的分类变量,“仅在根节点上”就需要 2^30 -1 次分割。总共有近 20 亿次 split 。
我真的很难清楚地理解这一点,我误解了过程的一部分。如果我计算 31 个值的排列数,结果是 8.22...e+33,这显然远远超过 20 亿。然而,组合数为 31^2 = 961。
在这种情况下,我们如何得出 2^30 次分割的需要?我似乎无法确定这里的规则或逻辑。它似乎不是基于组合学,如果我们只有 31 个值可供分割,我不明白我们如何需要 20 亿次分割。
任何指导将不胜感激。
谢谢
大卫
最佳答案
2^31 来自算法考虑每个可能的分割的想法。因此,左子节点有一组值,右子节点有其余值。
例如,如果前两个值向左移动,则分割将为 11000000000000。 . 。左侧为“1”,右侧为“0”。每个二进制数都是不同的分割(实际上是一半,因为左右是对称的)。
这是一个理论想法。实际情况是确定每个值的纯度测量值(31 次)。然后,根据估计的目标值对它们进行排序。 “较高”的值位于左侧子级,较低的值位于右侧(取决于其他条件,并允许多个拆分和数字目标)。该算法不会对 2^31 种不同的组合进行强力比较。
2^30 来自简单对称。您可以翻转 0 和 1 并获得相同的分割,即 111000000 。 。 。与 000111111 的分割相同。 。 。 child 交换了,但纯度是一样的。 - 1
是因为全 1 或 0 的分割根本不是分割;该算法需要两个子级用于递归分区部分。
关于machine-learning - CART 算法 - 为什么对分类变量进行 2^m-1 -1 分割?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46391632/
在过去的几个月里,我一直在研究 Haskell,我遇到了一个我不太确定如何处理的单子(monad)的情况。 我有一个 a -> m a 类型的值第二个类型为 m (a -> a)我需要对它们进行组合,
仿函数有 (a -> b) -> m a -> m b 应用程序有 f (a -> b) -> f a -> f b Monad 有 m a -> (a -> m b) -> m b 但是,是否有扩展
我是 Haskell 的新手,我想知道是否有比 Hoogle 更好的方法来确定一个库功能是否重复? 举个例子:我有很多函数f :: Monad a => a -> m a我想链接在一起,比如 f123
将存储在一系列列表中的 m、m、n 维数组组合成一个 m、m、n 维数组的方法是什么? 示例: 这是三个包含 m,m,n 维数组的列表: list1 <- array (1, dim = c(5, 5
有没有办法写一个函数f::(a -> b -> ... -> t) -> (Monad m => m a -> m b -> ... -> m t ),基本上是 liftMn 对于任何 n? (编辑:
我有一个像这样的 pandas 数据框: df = pd.DataFrame({'A':[1,3,2,9],'B':[2,1,2,7],'C':[7,2,4,6],'D':[8,1,6,4]},ind
这个问题来自文章“Trivial Monad”,地址:http://blog.sigfpe.com/2007/04/trivial-monad.html 。提供的答案是 h x y = x >>= (
所以>>= :: m a -> (a -> m b) -> m b和>> :: m a -> m b -> m b . 而 f b -> f a . 但我想要一些能m a -> (a -> m b)
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 3 年前。 Improve
当我安装 rakudo来源: $ git clone git@github.com:rakudo/rakudo.git $ cd rakudo $ perl Configure.pl --gen-mo
我正在尝试通过查看一些练习来提高我的 Idris 技能 Software Foundations (最初是为 Coq 设计的,但我希望对 Idris 的翻译不会太糟糕)。我在使用 "Exercise:
我想知道以下是否可行。 与服务器交换密码时,应保护密码。因此,用户可以使用生成的 key kUser 来加密密码。 Encrypt(m, kUser) 生成加密消息 eU(m)。现在用户将此信息发送到
这两个表之间存在什么样的关系(1:1、1:m、m:m,等等)? CREATE TABLE IF NOT EXISTS `my_product` ( `id` int(11) NOT NULL au
有人可以解释类型的含义以及如何实现吗? class Foldable f where foldMap :: (Monoid m) => (a -> m) -> f a -> m 基于 https:
例如,在 MVC 应用程序中,我可以使用 Html 助手来创建这样的标签: @Html.LabelFor(m => m.ProductName) 我没有在任何地方声明变量“m”,但 IDE 会自动找出
更新:澄清、更明确的重点和缩短的示例: 我可以避免 M op+(M&&,M&&) 过载吗?假设,我想很好地处理 RValues?我想其他三个重载是必需的。 我首先使用 (&&,&&) 重载的原因: 通
假设我有一个函数,它接受两个向量并返回一个整数,例如一个向量中也存在另一个向量中的元素数量。喜欢: f m [,1] [,2] [,3] [1,] "c" "i" "c" [2,] "
我想将字符串(字幕)转换为: 585 00:59:59,237 --> 01:00:01,105 - It's all right. - He saw us! 586 01:00:01,139 -->
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用,以及预
是否可以将 Linux 中的大文件将 d.m.Y h:m:s 转换为 Y-d-m h:m:s? 示例数据 "30.07.2016 00:00:00",DN123,PAPN,PAPN,TEST,9189
我是一名优秀的程序员,十分优秀!