gpt4 book ai didi

r - "Unnesting"R 中的数据帧

转载 作者:行者123 更新时间:2023-12-02 06:54:23 25 4
gpt4 key购买 nike

我有以下data.frame:

df <- data.frame(id=c(1,2,3), 
first.date=as.Date(c("2014-01-01", "2014-03-01", "2014-06-01")),
second.date=as.Date(c("2015-01-01", "2015-03-01", "2015-06-1")),
third.date=as.Date(c("2016-01-01", "2017-03-01", "2018-06-1")),
fourth.date=as.Date(c("2017-01-01", "2018-03-01", "2019-06-1")))

> df

id first.date second.date third.date fourth.date
1 1 2014-01-01 2015-01-01 2016-01-01 2017-01-01
2 2 2014-03-01 2015-03-01 2017-03-01 2018-03-01
3 3 2014-06-01 2015-06-01 2018-06-01 2019-06-01

每一行代表三个时间跨度;即 first.datesecond.datesecond.datethird.date 之间的时间跨度,以及分别为 third.datefourth.date

我想,没有更好的词了,取消嵌套数据框来获得这个:

  id  StartDate    EndDate
1 1 2014-01-01 2015-01-01
2 1 2015-01-01 2016-01-01
3 1 2016-01-01 2017-01-01
4 2 2014-03-01 2015-03-01
5 2 2015-03-01 2017-03-01
6 2 2017-03-01 2018-03-01
7 3 2014-06-01 2015-06-01
8 3 2015-06-01 2018-06-01
9 3 2018-06-01 2019-06-01

我一直在研究 tidyr 包中的 unnest 函数,但我得出的结论是我认为这不是我真正想要的为。

有什么建议吗?

最佳答案

你可以试试 tidyr/dplyr 如下:

library(tidyr)
library(dplyr)
df %>% gather(DateType, StartDate, -id) %>% select(-DateType) %>% arrange(id) %>% group_by(id) %>% mutate(EndDate = lead(StartDate))

您可以通过添加以下内容来消除每个 id 组中的最后一行:

%>% slice(-4)

到上面的管道。

关于r - "Unnesting"R 中的数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34662114/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com