gpt4 book ai didi

r - 增加样本数据的大小 - R

转载 作者:行者123 更新时间:2023-12-01 12:50:16 24 4
gpt4 key购买 nike

我的一位同事表示 randomForest() 在处理非常大的数据集时表现不佳。现在,我只是想弄清楚情况是否真的如此,但由于无法共享数据集(敏感信息),我想我不妨尝试提出一个大数据集。我尝试了以下操作,但无法理解错误消息:

library(randomForest)
data(iris)
dataFile <- iris
newdataFile <- dataFile[sample(dataFile, size= 1:1000000000, replace=T),]

错误信息:

Error in xj[i] : invalid subscript type 'list'

有人可以在这里指导我吗?

最佳答案

sample 接受一个向量。当从 data.frame 中采样时,人们通常通过将它们称为数字来对行进行采样,这与子集化非常相似,但在这种情况下,需要替换。

newdataFile <- iris[sample(nrow(iris),100000,replace=T),]

关于r - 增加样本数据的大小 - R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13016772/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com