gpt4 book ai didi

如果发生某些情况,R 在 data.table 中填充前导值和滞后值

转载 作者:行者123 更新时间:2023-12-05 08:37:13 24 4
gpt4 key购买 nike

我有一个 data.table 如下 -

NA20 <- rep(NA, 20)
dt <- data.table(
group = c(rep("A", 20), rep("B", 20), "C", "D", rep("E", 20)),
val = c(replace(NA20, 11, 2), replace(NA20, 6, 2), 2, NA, replace(NA20, c(5, 15), 2)))

> dt
group val
1: A NA
2: A NA
3: A NA
4: A NA
5: A NA
6: A NA
7: A NA
8: A NA
9: A NA
10: A NA
11: A 2
12: A NA
13: A NA
14: A NA
15: A NA
16: A NA
17: A NA
18: A NA
19: A NA
20: A NA
21: B NA
22: B NA
23: B NA
24: B NA
25: B NA
26: B 2
27: B NA
28: B NA
29: B NA
30: B NA
31: B NA
32: B NA
33: B NA
34: B NA
35: B NA
36: B NA
37: B NA
38: B NA
39: B NA
40: B NA
41: C 2
42: D NA
43: E NA
44: E NA
45: E NA
46: E NA
47: E 2
48: E NA
49: E NA
50: E NA
51: E NA
52: E NA
53: E NA
54: E NA
55: E NA
56: E NA
57: E 2
58: E NA
59: E NA
60: E NA
61: E NA
62: E NA

val列中,如果值为2,我想用-1填充前7个值,用1填充后7个值。这个操作应该由组来完成。

输出如下所示 -

    group val new
1: A NA NA
2: A NA NA
3: A NA NA
4: A NA -1
5: A NA -1
6: A NA -1
7: A NA -1
8: A NA -1
9: A NA -1
10: A NA -1
11: A 2 2
12: A NA 1
13: A NA 1
14: A NA 1
15: A NA 1
16: A NA 1
17: A NA 1
18: A NA 1
19: A NA NA
20: A NA NA
21: B NA -1
22: B NA -1
23: B NA -1
24: B NA -1
25: B NA -1
26: B 2 2
27: B NA 1
28: B NA 1
29: B NA 1
30: B NA 1
31: B NA 1
32: B NA 1
33: B NA 1
34: B NA NA
35: B NA NA
36: B NA NA
37: B NA NA
38: B NA NA
39: B NA NA
40: B NA NA
41: C 2 2
42: D NA NA
43: E NA -1
44: E NA -1
45: E NA -1
46: E NA -1
47: E 2 2
48: E NA 1
49: E NA 1
50: E NA -1
51: E NA -1
52: E NA -1
53: E NA -1
54: E NA -1
55: E NA -1
56: E NA -1
57: E 2 2
58: E NA 1
59: E NA 1
60: E NA 1
61: E NA 1
62: E NA 1

我遇到了一些极端情况,因此下面的一些解决方案停止了工作。如果可以更新解决方案以涵盖这些场景,我将不胜感激。我已经更新了上面的数据。下面列出了场景。

只有 Uwe 和 pseudospin 的解决方案是 100% 正确的并且涵盖了以下所有极端情况 -

  1. 一组中的所有值都是 NA
  2. 一组中只有一个值2
  3. 有多个 2,当它们被覆盖时,优先级将给予 1 而不是 -1。 (不是必须,但最好有场景)

谢谢

最佳答案

这是使用 data.table 的解决方案的 fcase()inrange()功能。它还处理多次出现的 2在一组以及其他边缘情况下。为了演示,我添加了一个组 E示例数据集:

NA20 <- rep(NA, 20)
dt1 <- data.table(
group = c(rep("A", 20), rep("B", 20), "C", "D", rep("E", 20)),
val = c(replace(NA20, 11, 2), replace(NA20, 6, 2), 2, NA, replace(NA20, c(5, 15), 2)))

dt1[, new := {
rn <- 1:.N
i2 <- which(val == 2)
fcase(
rn %inrange% .(i2 - 7, i2 - 1), -1,
rn %inrange% .(i2 + 1, i2 + 7), 1,
rn %in% i2, val
)
}, by = group][]
    group val new
1: A NA NA
2: A NA NA
3: A NA NA
4: A NA -1
5: A NA -1
6: A NA -1
7: A NA -1
8: A NA -1
9: A NA -1
10: A NA -1
11: A 2 2
12: A NA 1
13: A NA 1
14: A NA 1
15: A NA 1
16: A NA 1
17: A NA 1
18: A NA 1
19: A NA NA
20: A NA NA
21: B NA -1
22: B NA -1
23: B NA -1
24: B NA -1
25: B NA -1
26: B 2 2
27: B NA 1
28: B NA 1
29: B NA 1
30: B NA 1
31: B NA 1
32: B NA 1
33: B NA 1
34: B NA NA
35: B NA NA
36: B NA NA
37: B NA NA
38: B NA NA
39: B NA NA
40: B NA NA
41: C 2 2
42: D NA NA
43: E NA -1
44: E NA -1
45: E NA -1
46: E NA -1
47: E 2 2
48: E NA 1
49: E NA 1
50: E NA -1
51: E NA -1
52: E NA -1
53: E NA -1
54: E NA -1
55: E NA -1
56: E NA -1
57: E 2 2
58: E NA 1
59: E NA 1
60: E NA 1
61: E NA 1
62: E NA 1
group val new

在群里E 2 出现两次.出于好奇,我随意选择了重叠区域。从结果可以看出,调用fcase()中的第一个条件“胜”,即有七个连续的 -1 2 第二次出现之前.这可以通过交换对 fcase() 的调用中的第一个和第二个条件来验证。 .然后,我们会得到七个连续的 1 第一次出现 2 之后.

另请注意 data.table::fcase()dplyr::case_when() (在 AnilGoyal's answer 中使用)参数的解释方式不同。

A comment要求对 {} 中的语句进行解释子句。
data.table语法 x[i, j, by] , ij可以是表达式。所以,rni2在每个 group 中创建为临时变量为了节省对相同表达式的键入和重复计算。

  • rn <- 1:.N是每个组中行号的向量,其中 .N是一个包含组中行数的特殊符号。 1:.N相当于dplyr::row_number() .
  • i2 <- which(val == 2)是一个索引向量(组内),其中条件 val == 2满足。

整体{} expression 是一个更具可读性的版本

fcase(
1:.N %inrange% .(which(val == 2) - 7, which(val == 2) - 1), -1,
1:.N %inrange% .(which(val == 2) + 1, which(val == 2) + 7), 1,
1:.N %in% which(val == 2), val
)

警告

专栏val OP 的示例数据集的类型是double,但 OP 要求测试相等性。由于数字的有限表示形式,测试 double 的相等性可能会导致意想不到的结果(显然不是在这个用例中)。因此,我建议在适当的情况下使用 integer 类型,或者在涉及 double 的 if 子句中考虑数值公差

顺便说一句:data.table有充分的理由对数据类型特别挑剔。

关于如果发生某些情况,R 在 data.table 中填充前导值和滞后值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66191616/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com