gpt4 book ai didi

r - 如何使用 dplyr 估算 R 中的缺失变量?

转载 作者:行者123 更新时间:2023-12-03 22:54:06 28 4
gpt4 key购买 nike

我想为给定现有值的变量估算缺失值。
var2 ,我们注意到有很多NA s。

  • 如果任何 2 个 ID 相同,则它们的值 var2是相同的。
  • 如果 id 没有 var2 的值,就像 id==2 的情况一样,那么我们只输出为 NA .

  • 它应该来自 df_olddf_new.
     df_old<- read.table(header = TRUE, text = "
    id var1 var2
    1 A 12
    1 B NA
    1 E NA
    2 G NA
    2 J NA
    ")

    df_new<- read.table(header = TRUE, text = "
    id var1 var2
    1 A 12
    1 B 12
    1 E 12
    2 G NA
    2 J NA
    ")

    我试过:
    df_new<-df_old %>%
    group_by(id) %>%
    mutate(var2=na.omit(var2))

    我相信它不起作用,因为第二种情况。我还想知道使用 ifelse 是否可以。需要帮助谢谢!

    最佳答案

    如果只有一个 var2id 的值(value)可用你可以简单地做:

    df_old %>%
    group_by(id) %>%
    mutate(var2 = min(var2, na.rm = TRUE))

    Source: local data frame [5 x 3]
    Groups: id [2]

    id var1 var2
    <int> <fctr> <int>
    1 1 A 12
    2 1 B 12
    3 1 E 12
    4 2 G NA
    5 2 J NA

    另一种选择是:
    mutate(var2 = var2[1])

    关于r - 如何使用 dplyr 估算 R 中的缺失变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38390573/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com