gpt4 book ai didi

r - 当 R 中有重复项时保留最近的观察结果

转载 作者:行者123 更新时间:2023-12-05 08:51:09 25 4
gpt4 key购买 nike

我有以下数据。

  date                         var1    level       score_1     score_2
2020-02-19 12:10:52.166661 dog n1 1 3
2020-02-19 12:17:25.087898 dog n1 3 6
2020-02-19 12:34:27.624939 dog n2 4 3
2020-02-19 12:35:50.522116 cat n1 2 0
2020-02-19 12:38:49.547181 cat n2 3 4

对于 var1 和级别的任何组合,应该只有一个观察值。我想消除重复项并只保留最近的记录。在前面的例子中,第一行应该被删除,因为第二行的 dog-n1 是最近的。尽管如此,即使 var1 也等于“dog”,我还是想保留第 3 行,因为级别不同。

那么,我想得到的是:

  date                         var1    level       score_1     score_2
2020-02-19 12:17:25.087898 dog n1 3 6
2020-02-19 12:34:27.624939 dog n2 4 3
2020-02-19 12:35:50.522116 cat n1 2 0
2020-02-19 12:38:49.547181 cat n2 3 4

最佳答案

使用 tidyverse

df %>%
group_by(var1, level) %>%
filter(date == max(date)) %>%
ungroup()

关于r - 当 R 中有重复项时保留最近的观察结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60378970/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com