gpt4 book ai didi

r - 如何在后续行中估算缺失的观察值?

转载 作者:行者123 更新时间:2023-12-04 11:14:44 26 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





Replacing NAs with latest non-NA value

(18 个回答)


3年前关闭。




我在重新编码时遇到困难(在 R 或 SPSS 中填充空单元格)

我正在使用长格式数据集(为了运行多级模型),其中每个受访者(ID 变量)有三行,因此彼此下方的相同 ID 号的三倍(对于三个不同的时刻) .

问题在于,对于第二个变量(受访者的祖先),只有第一行有一个值,但每个受访者的第二行都错过了(相同的)值 (0/1)。任何人都可以帮忙吗?我只习惯在同一行内重新编码......低于数据格式。

ID      Ancestry    
1003 1
1003 .
1003 .
1004 0
1004 .
1004 .
1005 1
1005 .
1005 .

最佳答案

我们可以使用 na.locf假设 .暗示 NA值。

 library(zoo)
df1$Ancestry <- na.locf(df1$Ancestry)

如果该列是非数字的,即有 .作为值,那么我们需要将其转换为数字,以便 .强制到 NA 然后我们申请 na.locf在上面
 df1$Ancestry <- na.locf(as.numeric(df1$Ancestry))
df1$Ancestry
#[1] 1 1 1 0 0 0 1 1 1

如果需要按“ID”分组
 library(data.table)
setDT(df1)[, Ancestry := na.locf(Ancestry), by = ID]

关于r - 如何在后续行中估算缺失的观察值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37099617/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com