gpt4 book ai didi

r - 如何用奇怪的要求进行条件计算

转载 作者:行者123 更新时间:2023-12-04 09:31:02 25 4
gpt4 key购买 nike

我有一个奇怪的计算问题,我不知道我应该怎么做。我有一个看起来像这样的数据:
enter image description here
我首先需要按 ID 和日期排序,我就是这样做的。然后我需要找到基线日期,只有当该日期的持续时间 <= 0 并且最接近 0 时,才可以用作基线,然后我需要计算可用 = 当前分数/基线日期分数。所以最终结果应该是这样的:
enter image description here
我该怎么办?如何检查最旧的一天并构建“可用”以使用分数/最旧分数?
样本数据的代码是:

ID <-c("1","1","1","1","2","2","2","2")
Date<- c("4/19/2018","7/27/2018","8/24/2018","9/21/2018","10/19/2018","12/14/2018","1/11/2019","1/24/2019")
Duration <- c("-13","-7","95","142","2","36","75","81")
score <- c("0.06","0.071","0.054","0.0258","0.0208","0.0448","0.0638","0.0227")

Sample.data <- data.frame(ID, Date, Duration, score)

最佳答案

'Sample.data' 中的列都是 character class 作为引用的值(使用 R 4.0.0。如果它 < R 4.0,默认情况下为 stringsAsFactors = TRUE),所以我们使用 type.convert自动根据值更改类,然后在我们执行 arrange 之前在“ID”、“日期”上,将“日期”转换为 Date类(以防原始数据与顺序存在一些不一致),按“ID”分组后,创建带有 if/else 的新列“Useable”使用 first 返回标准化“分数”的条件'score' 的值或 else返回 NA

library(dplyr)
library(lubridate)
Sample.data <- Sample.data %>%
type.convert(as.is = TRUE) %>%
mutate(Date = mdy(Date)) %>%
arrange(ID, Date) %>%
group_by(ID) %>%
mutate(Useable = if(first(Duration) <=0) c(NA, score[-1]/first(score))
else NA_real_)
Sample.data
# A tibble: 8 x 5
# Groups: ID [2]
# ID Date Duration score Useable
# <int> <date> <int> <dbl> <dbl>
#1 1 2018-04-19 -13 0.06 NA
#2 1 2018-07-27 86 0.071 1.18
#3 1 2018-08-24 95 0.054 0.9
#4 1 2018-09-21 142 0.0258 0.43
#5 2 2018-10-19 2 0.0208 NA
#6 2 2018-12-14 36 0.0448 NA
#7 2 2019-01-11 75 0.0638 NA
#8 2 2019-01-24 81 0.0227 NA

关于r - 如何用奇怪的要求进行条件计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62841973/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com