= b. key "等条件合并两个表并选择max(c)记录?-6ren"> = b. key "等条件合并两个表并选择max(c)记录?-我想在 R 中做以下工作: 我有两个表 -- table.A 和 table.B 如下: table.A = b. key "等条件合并两个表并选择max(c)记录?,我们在Stack Overflo-6ren">
gpt4 book ai didi

r - [R]如何按 "a. key >= b. key "等条件合并两个表并选择max(c)记录?

转载 作者:行者123 更新时间:2023-12-04 10:36:53 27 4
gpt4 key购买 nike

我想在 R 中做以下工作:

我有两个表 -- table.A 和 table.B 如下:

table.A <- data.table(DATE = c(20110104, 20110105, 20110106, 20110107))
table.B <- data.table(ANN_DT = c(20101231, 20110105, 20110106),
RPT = c(20100630, 20091231, 20101231))

现在我想合并table.B进入table.A遵循以下规则:

  1. 对于 A 中的每条记录 DATE,找到 B 中所有 ANN_DT <= A.DATE 的记录
  2. 选择最大(RPT)的记录并合并到表A中

所以结果应该是这样的:

    DATE    B.ANN_DT      B.RPT
1 20110104 20101231 20100630
2 20110105 20101231 20100630
3 20110106 20110105 20101231
4 20110107 20110105 20101231

我可以直接通过 data.table 完成这项工作吗?函数而不是循环或 apply功能?

非常感谢!抱歉英语不好,因为我不是母语人士。

最佳答案

这个怎么样?

require(data.table) # v1.9.6+
B[order(ANN_DT), cmax_RPT := cummax(RPT)][]
B[, ANN_DT2 := B[B, ANN_DT, on=c(RPT= "cmax_RPT"), mult="first"]][]
ans = B[A, .(DATE, ANN_DT=ANN_DT2, RPT=cmax_RPT), roll=Inf, on=c(ANN_DT="DATE")]
ans
# DATE ANN_DT RPT
#1: 20110104 20101231 20100630
#2: 20110105 20101231 20100630
#3: 20110106 20110106 20101231
#4: 20110107 20110106 20101231

第一行存储RPT的累计最大值.第二行提取 ANN_DATE对应于 max 的值值(value)。

这是我们执行滚动连接所需的仅有的两列,它标识每个 A$DATE , B$ANN_DT 中的最大值那是 <=A$DATE .然后我们只提取 max和相应的ANN_DT值(value)。

由于这并没有实现所有的组合,所以这应该是非常有效的内存。因为这不评估 <=每个条件A$DATE ,这应该很快就足够了。

希望这对您有所帮助。

关于r - [R]如何按 "a. key >= b. key "等条件合并两个表并选择max(c)记录?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33863434/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com