gpt4 book ai didi

regex - 使用两个标准对 R 中的数据框进行子集化,其中之一是正则表达式

转载 作者:行者123 更新时间:2023-12-04 22:24:04 25 4
gpt4 key购买 nike

我有一个类似这样的数据集:

col_a col_b    col_c
1 abc_boy 1
2 abc_boy 2
1 abc_girl 1
2 abc_girl 2

我只需要根据 col_bcol_c 选取第一行,然后更改 col_c 中的 valye ,如下所示:
df[grep("_boy$",df[,"col_b"]) & df[,"col_c"]=="1","col_c"] <- "yes"
但是上面的代码是不行的,因为第一个条件和第二个条件不是来自同一个集合。

我可以通过使用显式循环以愚蠢的方式完成它,或者执行“两层”子集,如下所示:
df.a <- df[grep("_boy$",df[,"col_b"]),]              #1
df.b <- df[grep("_boy$",df[,"col_b"],invert=TRUE),] #2
df.a <- df.a[df.a[,"col_c"]=="1","col_c"] <- "yes" #3
df.a <- df.a[df.a[,"col_c"]=="2","col_c"] <- "no" #4
df <- rbind(df.a,df.b) #5

但我不喜欢,谁能启发我如何“合并” #1#3 ?谢谢。

最佳答案

尝试 grepl 而不是 grepgrepl 返回一个逻辑向量(匹配或不匹配 x 的每个元素),它可以与逻辑运算符组合。

关于regex - 使用两个标准对 R 中的数据框进行子集化,其中之一是正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8645118/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com