R:在按日期匹配行后，用第二个 dfrm 中的值替换第一个 dfrm 中多列中的 NA 值-6ren

R:在按日期匹配行后，用第二个 dfrm 中的值替换第一个 dfrm 中多列中的 NA 值

转载作者：行者123 更新时间：2023-12-04 09:21:18

30

4

这是我努力重建昨天出现的一个问题，我花了大部分时间解决这个问题，但再也找不到问题了。 2 个数据集 df1 和较小的 df2 具有相同的列名，并要求仅替换 date 行中的 NA 值。列匹配。我想合并可以做到，而且可能不那么繁重，但我正在寻找 match() -ing 和索引策略，最终找到了一个:

df1 <- structure(list(date = c(20040101L, 20040115L, 20040131L, 20040205L, 
20040228L, 20040301L, 20040315L, 20040331L), X11A = c(100L, 200L, 
NA, NA, NA, 150L, NA, NA), X11A.1 = c(150L, NA, 165L, NA, NA, 
155L, NA, NA), X21B = c(NA, 200L, 180L, NA, NA, 170L, 180L, NA
), X3CC = c(NA, NA, 190L, NA, NA, 150L, 190L, 175L), X3CC.1 = c(140L, 
NA, 190L, NA, NA, 160L, 200L, 180L)), .Names = c("date", "X11A", 
"X11A.1", "X21B", "X3CC", "X3CC.1"), class = "data.frame", row.names = c(NA, 
-8L))

df2 <- structure(list(date = c(20040228L, 20040131L, 20040331L), X11A = c(140L, 
170L, NA), X11A.1 = c(145L, NA, 145L), X21B = c(165L, NA, 160L
), X3CC = c(150L, NA, NA), X3CC.1 = c(155L, NA, NA)), .Names = c("date", 
"X11A", "X11A.1", "X21B", "X3CC", "X3CC.1"), class = "data.frame", row.names = c(NA, 
-3L))

实际提供的内容:

df1:

  date       11A    11A    21B    3CC    3CC
 20040101    100    150     NA     NA    140
 20040115    200     NA    200     NA     NA
 20040131     NA    165    180    190    190
 20040205     NA     NA     NA     NA     NA
 20040228     NA     NA     NA     NA     NA
 20040301    150    155    170    150    160
 20040315     NA      NA    180    190    200
 20040331     NA      NA     NA    175    180

df2:

 date        11A    11A    21B    3CC    3CC
 20040228    140    145    165    150    155
 20040131    170     NA     NA     NA     NA
 20040331     NA    145    160     NA     NA

最佳答案

is.na函数可以从数据帧参数创建逻辑的"template"。我的目标是创建这样一个模板，然后只选择带有 match 的行。两者之间的结果date列。使用 which arr.ind=TRUE 给出一个两列矩阵，可以用作 [<- 的单个参数或 [ :

valpos <- which(is.na(df1)[match(df2$date, df1$date), ], arr.ind=TRUE)

下一个任务是转换第一列(名为“行”)，以便用正确的行替换“目标”数据框:

targpos <- cbind( match(df2$date, df1$date)[ valpos[,'row'] ] , 
                  valpos[,'col'])

那么它只是:

> df1[targpos] <- df2[valpos]
> df1
      date X11A X11A.1 X21B X3CC X3CC.1
1 20040101  100    150   NA   NA    140
2 20040115  200     NA  200   NA     NA
3 20040131  170    165  180  190    190
4 20040205   NA     NA   NA   NA     NA
5 20040228  140    145  165  150    155
6 20040301  150    155  170  150    160
7 20040315   NA     NA  180  190    200
8 20040331   NA    145  160  175    180

当我将订单改组到日期时，我确实使问题变得更加困难。我认为这个逻辑也很难解决这个问题。

关于R:在按日期匹配行后，用第二个 dfrm 中的值替换第一个 dfrm 中多列中的 NA 值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37093727/

30

4

0

文章推荐： r - 找不到函数 plot.gam

文章推荐： r - 调整 Shiny 控件的标签位置

文章推荐： sql - Oracle Sql Developer "string literal too long"错误

r - NA 匹配 NA，但不等于 NA。为什么？
在 R Language Definition 中，对NA值进行了简要描述，其中一部分说 ... In particular, FALSE & NA is FALSE, TRUE | NA is TR
使用 na.approx 或 na.spline 替换矩阵数据的 NA
我对 R 还很陌生，目前遇到一个问题，数据如下所示: ID h1 h2 h3 h4 h5 h6 h7 h8
r - "NA"字符串转换为
我有一个 csv包含国家名称及其 ISO 代码的文件。这是它的样子: "Name","Code" "Afghanistan","AF" "Albania","AL" "Algeria","DZ" "N
按组将缺失值 (NA) 替换为最新的非 NA
我想用 dplyr 解决以下问题。最好与窗口功能之一一起使用。我有一个包含房屋和购买价格的数据框。下面是一个例子: houseID year price 1 19
用最新的非 NA 值替换 NA
在data.frame(或data.table)中，我想用最接近的先前非NA值“向前填充”NA。一个使用向量(而不是 data.frame)的简单示例如下: > y yy [1] NA NA NA
用最后一个有效值替换列中 NA 段的最后一个 NA
这是一个示例数据框: > df = data.frame(rep(seq(0, 120, length.out=6), times = 2), c(sample(1:50, 4), + NA, NA,
用 NA 替换
我有一个包含条目的数据框；似乎这些值不被视为 NA，因为 is.na 返回 FALSE。我想将这些值转换为 NA 但找不到方法。最佳答案使用 dfr[dfr==""]=NA哪里dfr是你的数据框。
当最后一个和下一个非 NA 值相等时替换 NA
我有一个示例表，其中包含一些但不是全部 NA需要替换的值。 > dat id message index 1 1 1 2 1 foo 2 3 1
r - 在 R 中，为什么从 NA 中减去数字会返回 NA 而从 NA 中减去日期会返回错误？
在 R 中，如果从 NA 中减去一个数字，它将返回 NA: > x NA - x [1] NA 但是如果你尝试从 NA 中减去一个日期，它会返回一个错误: > x NA - x Error in
r - 在 R 中，(F & NA) 是 F 但 (T & NA) 是 NA——为什么？
这个问题在这里已经有了答案: Logical operators (AND, OR) with NA, TRUE and FALSE (2 个答案) 关闭 4 年前。为什么在 R 中会这样？ >
r - 使用 na.omit r NA.RM 和 lapply 在 Dataframe 的多列中忽略 R 中的 NA
我有一个看起来像这样的数据框: SampleNo Lab1 Lab2 Lab3 lab4 lab5 lab6 lab7 lab8 lab9 lab10 1 59
r - 按组在第一个非 NA 值之前填充缺失值 (NA)
我有一个按“id”分组的数据框和一个包含缺失值的变量“age”，NA。在每个“id”中，我想替换“age”的缺失值，但只“填充”之前第一个非NA 值。 data % group_by(id) %
r - 如何替换数据帧行中的 NA，其中行不是全部 NA
我有如下所示的数据框: df df id value v1 v2 v3 1 1 351 NA 1 0 2 2 585 0 1 1 3 3 321 NA 0 1 4
R: is.na() 不获取 NA 值
所以我有一个数据集，只需查看它，数据集中就有明显的 NA。 > dput(bmi.cig) structure(list(MSI.subset.BMI = structure(c(4L, 4L, 4
r - 将单个栅格设置为 NA，其中栅格堆栈的值为 NA
我有两个 30m x 30m 的光栅文件，我想从中采样点。在采样之前，我想从图像中移除模糊区域。我求助于 R 和 Hijman 的 Raster 包来完成这项任务。使用 drawPoly(sp=TR
r - na.locf 但不要做尾随 NA
我有以下时间序列 > y y[c(1,2,5,9,10)] y [,1] 2011-09-04 NA 2011-09-05 NA 2011-09-06 3 201
r - 如何按组用最新的非 NA 替换 NA？
这个问题在这里已经有了答案: Replace missing values (NA) with most recent non-NA by group (7 个回答) 5年前关闭。我有一个 DF 个
r - 如果任何其他变量为 NA，则设置新变量 NA
我想向我的数据框中添加一个新变量 (N_notNAs)，它定义了其他任何变量是否为 NA。 x y z N_notNAs 2 3 NA NA NA 1 3 NA 2
r - 和 NA 有什么区别？
我有一个名为 SMOKE 的因子，级别为“Y”和“N”。缺失值被替换为 NA(从初始级别“NULL”开始)。然而，当我查看这个因素时，我得到这样的结果: head(SMOKE) # N N Y Y
将 NA 替换为 NA 前后情况的平均值
假设我有以下 data.frame: t<-c(1,1,2,4,5,4) u<-c(1,3,4,5,4,2) v<-c(2,3,4,5,NA,2) w<-c(NA,3,4,5,2,3) x<-c(2,

首页

博学

6Ren·AI

商城

R:在按日期匹配行后，用第二个 dfrm 中的值替换第一个 dfrm 中多列中的 NA 值