gpt4 book ai didi

r - 如何找到值低于 0 的 5 行或更多行(日期)系列的第一行(日期)

转载 作者:行者123 更新时间:2023-12-02 06:46:21 32 4
gpt4 key购买 nike

我有以下日期的平均温度数据。我想找到连续至少 5 天低于或高于 0 摄氏度的开始日期。

  date_short mean.temp
1 2018-05-18 17.54
2 2018-05-19 19.45
3 2018-05-20 22.31
4 2018-05-21 13.26
5 2018-05-22 10.29
6 2018-05-23 15.06

我使用了以下脚本并找出有多少天低于 0 以及哪些行符合低于 0 温度的标准。显示0度以下的天数共147天,观测到0度以下的天数在哪一行。从那里我可以看到第 161 个日期是温度低于 0 度的第一天,但​​这不是我想要的,因为它不是至少 5 天温度低于或高于 0 度的系列的第一个日期。相反,我希望 R 返回第 170 天,因为它是低于或高于 0 度的至少 5 天系列的开始。

length(which(d.mean$mean.temp <= 0))
[1] 147
which(d.mean$mean.temp <= 0)
[1] 161 162 166 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195
[30] 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224
[59] 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253
[88] 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282
[117] 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 307 308 309 310 313 314 315 316 317
[146] 318 324

我如何在 R 中完成它。我可以手动完成,但我必须为许多列找到这样的日期。在 Excel 中,函数如下所示。

IF(B2<0, IF(B3<0, IF(B4<0, IF(B5<0, IF(B6<0,A2,""),""),""),""),"")

提前致谢

最佳答案

基数R的rle(游程编码)函数就足以做到这一点,例如

# sample data
set.seed(47)
df <- data.frame(
date = seq(as.Date("1970-01-01"), length = 500, by = "days"),
temp = rnorm(500)
)

runs <- rle(df$temp < 0)

df[(cumsum(runs$lengths) - runs$lengths + 1)[runs$values & runs$lengths >= 5], ]
#> date temp
#> 25 1970-01-25 -0.3264668
#> 270 1970-09-27 -0.5443173
#> 350 1970-12-16 -0.8436569
#> 356 1970-12-22 -1.2768785
#> 370 1971-01-05 -1.4122783
#> 431 1971-03-07 -0.4711361
#> 454 1971-03-30 -0.9901146

要稍微分解一下,请查看组件部分:

runs
#> Run Length Encoding
#> lengths: int [1:235] 3 1 1 2 1 3 2 1 2 1 ...
#> values : logi [1:235] FALSE TRUE FALSE TRUE FALSE TRUE ...

# start index of each run
head((cumsum(runs$lengths) - runs$lengths + 1), 20)
#> [1] 1 4 5 6 8 9 12 14 15 17 18 19 22 23 24 25 30 33 34 37

# runs where temp < 0 and length >= 5
head(runs$values & runs$lengths >= 5, 20)
#> [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
#> [13] FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE

# together, indices of first rows which satisfy the conditions
(cumsum(runs$lengths) - runs$lengths + 1)[runs$values & runs$lengths >= 5]
#> [1] 25 270 350 356 370 431 454

关于r - 如何找到值低于 0 的 5 行或更多行(日期)系列的第一行(日期),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60584458/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com