- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道当我们使用Bagging进行分类时,可以调整哪些参数以及是否可以使用交叉验证来调整它?
在 Bagging function in R ,它说我们可以使用 nbagg 来更改引导复制的数量。并使用rpart.control .
这是我的代码装袋(收入~.,data=training3,coob=T)
最佳答案
何时在分类中使用 bagging?
装袋本质上是从单个训练集中重复采样,以生成 x 个不同的引导训练数据集。然后,我们在这些训练集上训练我们的方法,并在回归的情况下对所有预测进行平均,在分类的情况下我们使用投票。装袋有助于减少结果的方差,因此,如果结果的方差非常大,您通常会选择装袋,但随机森林和提升技术通常优于装袋技术。
哪些参数可以调整,我们可以使用交叉验证来调整它吗?
nbagg: nbagg参数用于控制决策树投票的数量在整体中(默认值为 25)。根据学习任务的难度和训练数据量,增加这个数字可能会提高模型的性能,但需要额外的计算费用。
cp: cp 是复杂性参数,正确调整后会给出修剪树,复杂性参数 (cp) 用于控制决策树的大小并选择最佳树大小。如果从当前节点向决策树添加另一个变量的成本高于 cp 的值,则树构建不会继续,您可以点击并尝试绘制它,看看什么适合您。
我们可以使用交叉验证吗?
是的,你可以,但是你应该使用插入符包来做到这一点(只是为了让你的生活变得简单)
library(caret)
set.seed(1729)
cntrl <- trainControl(method = "cv", number = 10)
train(dependent_variable ~ ., data = mydata, method = "treebag",
trControl = cntrl)
关于r - 如何调整R中Bagging的参数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47725938/
我是 HADOOP 和 PIG 的新手。 我有两个包: DUMP A: (1) (2) (4) DUMP B: (1,John,USA) (2,Richard,UK) (3,Ian,Ireland)
我有一个例子,我们正在尝试做一个看似简单的连接: A = load 'data6' as ( item:chararray, d:int, things:bag{(thing:chararray, d
研究该主题,可以找到作者使用“词袋”模型进行图像分类/检索的论文,而其他人则使用“特征袋”模型进行类似任务。 尽管我对所涉及的方法有基本的了解(检测和提取视觉词、构建视觉词典、使用机器学习训练分类器)
手册/文档广泛使用了“内袋”和“外袋”的语言(例如: http://pig.apache.org/docs/r0.11.1/basic.html ),但我无法清楚地确定分隔这些术语的精确定义。 例如所
这个问题已经有答案了: Type mismatch: cannot convert from Item to Item (1 个回答) 已关闭 7 年前。 我很困惑。我无法将外部类的实例变量 Node
我正在尝试使用 ORB 作为我的 detector 和 extractor 以及 BruteForce 创建一个词袋程序> 用于匹配器。 一切正常。 但我担心的是,当我尝试对我的描述符数组进行聚类时,
题目地址:https://leetcode.com/problems/bag-of-tokens/description/ 题目描述 Youhave an initial power P, an
我正在寻找一种数学变换,以将2D平面[0,1]x[0,1]上的点变换到单位球面上。 最常见的投影是通过将u和v解释为球坐标的角度来进行纬度-经度映射(将u映射为[0,2PI]和v映射为[-PI/2,
我有这个RDF A B D 1 C
我一直在看this tutorial标签部分让我感到困惑。不是标记本身的行为,而是教程中显示过程的方式。 更具体地说,#pragma omp 部分: #pragma omp parallel for
当使用 dask.bag 读取 json 文件时,如果文件中的 json 是多行,我会收到 JSONDecodeError 。 import json import dask.bag as db db
我不确定这个论坛是否适合这个问题,否则我很抱歉。 我对 Bag of Features 很陌生模型,我正在尝试实现以通过 vector 表示图像(对于 CBIR 项目)。 据我了解,给定训练集 S的
我正在尝试实现Haskell Bag(多集)。 到目前为止,我已经有了 data Bag a = EmptyBag | ListBag [(a, Integer)] deriving (Eq, Sho
我已经研究了 bag 和 idbag 之间的区别,我理解它们之间的区别,但我想了解的是,如果使用 bag 而不是 idbag ,是否会出现问题,反之亦然。有人可以用一个例子解释一下吗? 最佳答案 Ba
考虑以下 Hibernate 映射文件: ... 当我运行以下命令时: _session.EnableFil
我正在为 Fox and Geese 类型的游戏编写 AI。我的谓词之一如下所示: moveFox(+PrevState, -NextState, -PegList, +VisitedStates,
我刚刚开始学习 Haskell,但还没有掌握函数式编程。我需要创建一个多态数据类型,在运行我编写的函数之一之前我不知道其类型。该程序似乎希望我从列表中构建元组列表,例如: ['Car', 'Car',
我想像下面这样定义包 在上述情况下,hbm 文件中存在 xml 错误: 元素类型“bag”的内容必须匹配 “(元*,子选择?,缓存?,同步*,注释?,键,(元素|一对
Here ,我看到 Bag 类应该位于 java.util.Collection 中,但是当我尝试使用它时,我得到无法解析为类型 > 错误。 我应该复制+粘贴this或者是否缺少一些库? 最佳答案 这
我正在尝试使用 dask.bag 来保存给定类的对象,其中每个实例捕获文档的各种属性(标题、字数等)。 该对象有一些关联的方法,用于设置该对象的不同属性。 例如: import dask.bag as
我是一名优秀的程序员,十分优秀!