gpt4 book ai didi

r - 邻近矩阵 - 随机森林,R

转载 作者:行者123 更新时间:2023-12-04 09:31:11 26 4
gpt4 key购买 nike

我在 R 中使用 randomForest 包,它允许计算邻近矩阵 (P)。在包的描述中,它将参数描述为:“如果调用 randomForest 时接近度 = TRUE,则输入之间的接近度度量矩阵(基于数据点对位于同一终端节点中的频率)。”

我获得随机森林的邻近矩阵如下:

P <- randomForest(x, y, ntree = 1000, proximity=TRUE)$proximity

当我调查 P 矩阵时,我看到类似 P(i,j)=0.971014493 的值,其中 i 和 j 是我的训练数据集 (x) 中的两个数据实例。这样的值没有意义,因为当它乘以 1000(森林中的树木数量)时,结果数字不是整数,因此是“频率”。有人可以帮我理解,为什么我会在邻近矩阵中得到这样的实数?

最佳答案

因为就像默认预测一样,默认接近度仅使用树来计算,其中用于构建该树的样本中没有包含任何观察(它们是“out-of-bag”)。

每对案例发生这种情况的次数会略有不同,而且肯定不会是像 1000 这样的好整数。

您会注意到在 proximity 之后列出的下一个参数被称为 oob.prox指示是仅使用袋外对(默认值)还是使用每一棵树。

关于r - 邻近矩阵 - 随机森林,R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23761942/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com