gpt4 book ai didi

r - 如何在 R 中按顺序有条件地标记行?

转载 作者:行者123 更新时间:2023-12-04 10:11:13 25 4
gpt4 key购买 nike

我希望根据 sample 的数量是比之前的 sample 多还是少 500 来标记 sample 。我看过条件标签的示例,但找不到适合我需要的示例。

例如我的数据是这样的:

column a
200
230
510
1200
1800
1700
2400

我希望根据每个样本是否彼此接近最多 500 来标记每个样本。因此输出将是:

column a     column b
200 region1
230 region1
510 region1
1200 region2 #new region starts as there is more than 500 difference than 510 (690)
1400 region2
1700 region2
2400 region3 #new region starts as there is 700 difference from 1700

我看过条件标签的示例,但对于所有这些示例,都有一定数量的标签(例如只有二进制标签),我需要标签编号(区域编号)随着每个新区域的增加而增加。我怎样才能做到这一点?我尝试过改编其他示例,但我在设置 if more than 500 new label 条件和顺序标记方面几乎没有什么进展。

最佳答案

您可以使用diffcumsum

x$b  <-  paste0("region", c(1, 1+cumsum(diff(x$a) > 500)))
x
# a b
#1 200 region1
#2 230 region1
#3 510 region1
#4 1200 region2
#5 1800 region3
#6 1700 region3
#7 2400 region4

数据

x  <- data.frame(a=c(200,230,510,1200,1800,1700,2400))

关于r - 如何在 R 中按顺序有条件地标记行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59031575/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com