gpt4 book ai didi

r - 根据同一数据框中的条件生成其他行

转载 作者:行者123 更新时间:2023-12-04 10:31:26 26 4
gpt4 key购买 nike

我有一个像下面 DF 这样的数据框,它将直接从数据库中导入(作为 tibble)。

library(tidyverse)
library(lubridate)


date_until <- dmy("31.05.2019")
date_val <- dmy("30.06.2018")

DF <- data.frame( date_bal = as.Date(c("2018-04-30", "2018-05-31", "2018-06-30", "2018-05-31", "2018-06-30")),
department = c("A","A","A","B","B"),
amount = c(10,20,30,40,50)
)

DF <- DF %>%
as_tibble()
DF

它表示每个部门在特定月份花费的金额。我的任务是预测每个部门在接下来的几个月中将花费多少钱,直到 future 的指定日期(在本例中为 date_until=31.05.2019)

我想使用 tidyverse 为每个部门生成额外的行,其中第一列 date_bal 将是从“原始”DF 的最后一个日期到预定义的 date_until 的一系列日期。然后我想添加名为“DIFF”的附加列,它表示 DATE_BAL 和 DATE_VAL 之间的差异,其中 DATE_VAL 也是预定义的。我的最终结果如下所示: Final result

我已经设法通过以下方式做到这一点:

  1. 首先为部门A过滤来自DF的数据
  2. 通过使用从 1 开始的 min(dat_bal) 到 date_until 的日期序列填充它来创建另一个 DF2。
  3. 合并 1. 和 2. 的数据帧,然后使用 mutate 添加计算列

由于我将不得不为许多部门重复此过程,我想知道是否可以在现有 DF 中添加行(创建日期序列)(无需创建第二个 DF 然后合并)。

在此先感谢您的帮助和时间。

最佳答案

我在日期中添加一天,创建一个序列,然后回滚到上个月的最后一天。

seq(min(date_val + days(1)), date_until + days(1), by = 'months')[-1] %>% 
rollback() %>%
tibble(date_bal = .) %>%
crossing(DF %>% distinct(department)) %>%
bind_rows(DF %>% select(date_bal, department)) %>%
left_join(DF) %>%
arrange(department, date_bal) %>%
mutate(
amount = if_else(is.na(amount), 0, amount),
DIFF = interval(
rollback(date_val, roll_to_first = TRUE),
rollback(date_bal, roll_to_first = TRUE)) %/% months(1)
)

关于r - 根据同一数据框中的条件生成其他行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56588358/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com