gpt4 book ai didi

r - 在 R 中生成随机数量的缺失值

转载 作者:行者123 更新时间:2023-12-01 07:58:40 25 4
gpt4 key购买 nike

我有一个这样的数据框:

df<-data.frame(time1=rbinom(100,1,0.3),
time2=rbinom(100,1,0.4),
time3=rbinom(100,1,0.5),
time4=rbinom(100,1,0.6))

我怎样才能为每个时间变量生成随机缺失值,缺失数量高达 20%?即,在这种情况下,每列中缺失的总数小于 20,并且它们是从主题(行)中随机缺失的。

最佳答案

你可以这样做:

insert_nas <- function(x) {
len <- length(x)
n <- sample(1:floor(0.2*len), 1)
i <- sample(1:len, n)
x[i] <- NA
x
}

df2 <- sapply(df, insert_nas)
df2

这将为您提供每列最多 20% 的缺失
colSums(is.na(df2)) / nrow(df2)

time1 time2 time3 time4
0.09 0.16 0.19 0.14

关于r - 在 R 中生成随机数量的缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20951962/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com