gpt4 book ai didi

r - 随机或按比例为 NA 分配分类值

转载 作者:行者123 更新时间:2023-12-01 14:19:02 25 4
gpt4 key购买 nike

我有一个数据集:

df <- structure(list(gender = c("female", "male", NA, NA, "male", "male", 
"male"), Division = c("South Atlantic", "East North Central",
"Pacific", "East North Central", "South Atlantic", "South Atlantic",
"Pacific"), Median = c(57036.6262, 39917, 94060.208, 89822.1538,
107683.9118, 56149.3217, 46237.265), first_name = c("Marilyn",
"Jeffery", "Yashvir", "Deyou", "John", "Jose", "Daniel")), row.names = c(NA,
-7L), class = c("tbl_df", "tbl", "data.frame"))

我需要进行分析,这样我就不能拥有 NA gender 中的值多变的。其他列太少且没有已知的预测值,因此实际上不可能估算这些值。

我可以通过完全删除不完整的观察来进行分析——它们大约占数据集的 4%,但我想通过随机分配 female 来查看结果。或 male进入失踪案件。

除了编写一些非常丑陋的代码来过滤不完整的情况之外,将其分成两部分并替换 NA s 与 femalemale在每一半中,我想知道是否有一种优雅的方法可以将值随机或按比例分配到 NA 中。 ?

最佳答案

我们可以使用 ifelseis.na确定是否na存在,然后使用 sample随机选择 femalemale .

df$gender <- ifelse(is.na(df$gender), sample(c("female", "male"), 1), df$gender)

关于r - 随机或按比例为 NA 分配分类值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54846035/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com