- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我遇到了一个奇怪的问题。我已在笔记本电脑上成功运行此代码,但是当我尝试首先在另一台计算机上运行它时,我收到此警告未指定分布,假设伯努利...,这是我所期望的,但随后出现此错误:object$var.levels[[i]] 中出现错误:下标超出范围
library(gbm)
gbm.tmp <- gbm(subxy$presence ~ btyme + stsmi + styma + bathy,
data=subxy,
var.monotone=rep(0, length= 4), n.trees=2000, interaction.depth=3,
n.minobsinnode=10, shrinkage=0.01, bag.fraction=0.5, train.fraction=1,
verbose=F, cv.folds=10)
有人可以帮忙吗?数据结构完全相同,代码相同,R 相同。我在这里甚至没有使用下标。
编辑:traceback()
6: predict.gbm(model, newdata = my.data, n.trees = best.iter.cv)
5: predict(model, newdata = my.data, n.trees = best.iter.cv)
4: predict(model, newdata = my.data, n.trees = best.iter.cv)
3: gbmCrossValPredictions(cv.models, cv.folds, cv.group, best.iter.cv,
distribution, data[i.train, ], y)
2: gbmCrossVal(cv.folds, nTrain, n.cores, class.stratify.cv, data,
x, y, offset, distribution, w, var.monotone, n.trees, interaction.depth,
n.minobsinnode, shrinkage, bag.fraction, var.names, response.name,
group)
1: gbm(subxy$presence ~ btyme + stsmi + styma + bathy, data = subxy,var.monotone = rep(0, length = 4), n.trees = 2000, interaction.depth = 3, n.minobsinnode = 10, shrinkage = 0.01, bag.fraction = 0.5, train.fraction = 1, verbose = F, cv.folds = 10)
是否因为我将保存的 R 工作区移动到另一台计算机而有什么关系?
编辑2:好的,所以我已经更新了代码运行的机器上的gbm包,现在我得到了同样的错误。因此,此时我认为较旧的 gbm 软件包可能没有进行此检查,或者较新的版本存在一些问题。我不太了解gbm,无法说。
最佳答案
只是一种预感,因为我看不到您的数据,但我相信当测试集中存在但训练集中不存在的变量级别时,就会发生错误。
当您的因子变量具有大量级别,或者一个级别的实例数较少时,很容易发生这种情况。
由于您使用的是 CV 折叠,因此其中一个循环上的保留集可能对训练数据具有外部级别。
我建议:
A) 使用 model.matrix() 对因子变量进行 one-hot 编码
B) 继续设置不同的种子,直到获得不发生此错误的 CV 分割。
编辑:是的,通过该回溯,您的第三个 CV 保留在其测试集中有一个在训练中不存在的因子水平。因此预测函数看到一个外部值并且不知道该怎么做。
编辑2:这是一个简单的例子来展示我所说的“不在测试集中的因子水平”的含义
#Example data with low occurrences of a factor level:
set.seed(222)
data = data.frame(cbind( y = sample(0:1, 10, replace = TRUE), x1 = rnorm(10), x2 = as.factor(sample(0:10, 10, replace = TRUE))))
data$x2 = as.factor(data$x2)
data
y x1 x2
[1,] 1 -0.2468959 2
[2,] 0 -1.2155609 6
[3,] 0 1.5614051 1
[4,] 0 0.4273102 5
[5,] 1 -1.2010235 5
[6,] 1 1.0524585 8
[7,] 0 -1.3050636 6
[8,] 0 -0.6926076 4
[9,] 1 0.6026489 3
[10,] 0 -0.1977531 7
#CV fold. This splits a model to be trained on 80% of the data, then tests against the remaining 20%. This is a simpler version of what happens when you call gbm's CV fold.
CV_train_rows = sample(1:10, 8, replace = FALSE) ; CV_test_rows = setdiff(1:10, CV_train_rows)
CV_train = data[CV_train_rows,] ; CV_test = data[CV_test_rows,]
#build a model on the training...
CV_model = lm(y ~ ., data = CV_train)
summary(CV_model)
#note here: as the model has been built, it was only fed factor levels (3, 4, 5, 6, 7, 8) for variable x2
CV_test$x2
#in the test set, there are only levels 1 and 2.
#attempt to predict on the test set
predict(CV_model, CV_test)
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) :
factor x2 has new levels 1, 2
关于r - gbm 函数下标越界,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18640169/
我最近才开始学习 Clojure,所以很抱歉,如果这有点初级: 有人可以向我解释一下两者之间的区别吗: => (def a (lazy-cat [0]
我有一些看起来像这样的数据: X = [[1,2,3,4],[01010],[-1.6]] y = [[4,2]] 我正在尝试使用 tflearn 在这些数据上训练神经网络。我使用的是 TFlearn
我的代码有问题。 我正在尝试从 .txt 文件中提取 channel 名称。我不明白为什么方法 line.split() 给我返回一个长度为 0 的数组: 有人可以帮助我吗? 这是文件.txt: --
def sigmoid(z): # complete the code z = np.asarray(z) if z.ndim == 0: return(1/(1+np.exp(-z))) e
我在访问 3d 数组内的值时遇到问题。有时它给出正确的值,但有时它给出随机的数值。数组内不存在。 import java.util.*; public class Main { public
我有一段代码,执行时会出现此错误。而且我比较新,我似乎无法解决问题。 错误:2011-09-06 12:31:06.094 ForceGauge[266:707] CoreAnimation:忽略异常
我正在尝试限制 http://www.liftdesignphoto.com/test/ 中的滚动因为它让电梯超出了界限。 有没有办法重新计算位置,使其不越界? (也许使用 %)。 谢谢 最佳答案 假
我正在尝试遍历 6 个“国际象棋”棋子的列表。每轮他们移动一个随机数量,如果他们落在另一个上,他们就会“杀死”它。 问题是,当我的 vector 中的最后一 block 杀死另一 block 时,我收
NumberPicker serviceWheel = (NumberPicker) findViewById(R.id.serviceSelector); serviceWheel.setMaxVa
我正在尝试使用 GridLayout 重现此计算器布局 但这就是我用我尝试过的代码得到的结果。 事实上,在设备上情况会变得更糟,它会削减更多必须跨越两行的最后一个相等按钮。
运行测试脚本时出现“标签越界”错误。将注释值与类数进行比较时,confusion_matrix 函数会抛出错误。在我的例子中,注释值是一个图像(560x560)和 number_of_classes
什么是 OOL(越界)代码?我在 ION 编译器中找到了它,但无法理解发生了什么。 bool CodeGeneratorShared::generateOutOfLineCode() { for
这是我正在研究的有趣的事情。 varray.c: static GLint vertices[] = {25, 25, 100, 325,
我的程序将文件读取到字节数组中,然后尝试从该文件中提取 bmp 图像。问题是我遇到了越界错误。 { public static void main( String[] args ) {
我有一个 UITableView,它由从 XML 提要解析的数据数组填充。我正在努力寻找此错误的原因,并想知道是否有人可以帮助我。该错误不会经常发生。它仅在数组数量很大时发生,例如 10-15 个对象
public class GameEntry { private String name; private int score; public GameEntry(String
我遇到了 Storyboard的问题(至少有点惊讶)。 我有一个 ViewController,它包含一个容器 View 以及各种 ImageView 。自然地,选择的 ImageView 决定了容器
我正在尝试为一些 textfield 设置动画。即在屏幕外开始动画并移动到屏幕中央。但就我而言,动画从中心开始并超出 bounds。当我在 viewWillAppear/viewDidAppear 中
closeTs在struct tic给我一个错误 - tsP=0x66 .我尝试从 oracle 条目中填充它,如果没有,我尝试分配一个值。但我在 fillFields 中访问错误.有人可以给我提示
public class Registration { public static void main(String[] args) { final String MY
我是一名优秀的程序员,十分优秀!