gpt4 book ai didi

r - 在r中生成大量样本

转载 作者:行者123 更新时间:2023-12-02 07:57:32 26 4
gpt4 key购买 nike

我有一个50行4列的数据框。我想要获得12行的许多示例数据帧,可能是一百万行,而且我不希望我的两个示例数据帧相同。我使用了以下代码

    df_l <- list()
for(i in 1:6000000) {
set.seed(100+i)
a <- df[sample(nrow(df),12,replace=T),]
df_l[[i]] <- a
rownames(df_l[[i]]) <- 1:12
}

但是我的困惑是,这可能不是执行此操作的有效方法,而且我不知道两个示例数据帧是否相同。

最佳答案

您可以尝试以下代码:

采样时不更换


  • n <- nrow(df)
    df_1 <- replicate(6000000,df[sample(n,12),],simplify = FALSE)

    采样
  • 时替换

  • n <- nrow(df)
    df_1 <- replicate(6000000,df[sample(n,12,replace = TRUE),],simplify = FALSE)

    关于相同数据帧的关注,取决于您从中采样的空间大小。对你来说
  • 如果您不允许替换,则您的空间大小为choose(50,12)*factorial(12),它比6000000大得多。因此,碰撞的可能性低。
  • (如果允许替换),则您的空间大小为50**12*factorial(12),甚至比没有替换的情况更大。因此,碰撞的可能性会低得多。
  • 关于r - 在r中生成大量样本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61814213/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com