gpt4 book ai didi

r - R 中每组第 k_ 个最小元素

转载 作者:行者123 更新时间:2023-12-04 12:26:01 27 4
gpt4 key购买 nike

我有一个数据表,dt ,看起来像

   location year value
NYC 2026 1
NYC 2026 2
NYC 2026 3
NYC 2026 4
NYC 2026 5
LA 2026 6
LA 2026 7
LA 2026 8
LA 2026 9
LA 2026 10

我想通过 city 将它们分组和 year并找到第二个最小的元素
栏目 value , 每组,其中所需的结果如下所示:
   location year value
NYC 2026 2
LA 2026 7
dt %>% grou_by(location, year) %>% nth(value, 2)
行不通。任何帮助表示赞赏。

上面的数据表可以通过以下方式创建:
dt <- structure(list(location = c("NYC", "NYC", "NYC","NYC", "NYC", 
"LA", "LA", "LA", "LA", "LA"),
year = c(2026, 2026, 2026, 2026, 2026,
2026, 2026, 2026, 2026, 2026),
value = c(1, 2, 3, 4, 5,
6, 7, 8, 9, 10)),
class = "data.table",
row.names = c(NA, -10L))

最佳答案

一个dplyr可能是:

df %>%
group_by(location) %>%
arrange(value) %>%
slice(2)

这里它按“位置”列分组,根据“值”列排列值,然后保留第二个元素。
  location  year value
<chr> <int> <int>
1 LA 2026 7
2 NYC 2026 2

或者,如果“值”列中的值可能重复,则您可以执行以下操作:
df %>%
group_by(location) %>%
distinct(value, .keep_all = TRUE) %>%
arrange(value) %>%
slice(2)

或使用 filter()而不是 slice() :
df %>%
group_by(location) %>%
arrange(value) %>%
filter(row_number() == 2)

同样考虑也可能重复:
df %>%
group_by(location) %>%
distinct(value, .keep_all = TRUE) %>%
arrange(value) %>%
filter(row_number() == 2)

或使用 filter()dense_rank() :
df %>%
group_by(location) %>%
filter(dense_rank(value) == 2)

同样考虑也可能重复:
df %>%
group_by(location) %>%
distinct(value, .keep_all = TRUE) %>%
filter(dense_rank(value) == 2)

关于r - R 中每组第 k_ 个最小元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56084877/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com