gpt4 book ai didi

r - 在 R 的一列中保留数据框中包含相同值的行

转载 作者:行者123 更新时间:2023-12-02 16:27:39 24 4
gpt4 key购买 nike

考虑以下数据框:

Gene <- c("PNKD;TMBIM1", "PNKD", "PKHD1", "PKHD1", "SCN1A", "RBMX", "RBMX", "MUC4", "CASKIN;TRAF7", "CASKIN", "LIFR")
Score <- c(0.9, 0.2, 0.5, 0.6, 0.1, 0.985, 0.238, 0.65, 0.9, 0.66, 0.6)
df <- data.frame(Gene, Score)
df

我想在“基因”列中选择此数据框中包含相同字符串的行。我想要以下输出:

Gene <- c("PNKD;TMBIM1", "PNKD", "PKHD1", "PKHD1", "RBMX", "RBMX","CASKIN;TRAF7", "CASKIN")
Score <- c(0.9, 0.2, 0.5, 0.6, 0.985, 0.238, 0.65, 0.9)
df <- data.frame(Gene, Score)

df

最佳答案

你的意思是像下面这样的吗

subset(
df,
grepl(
paste0(subset(data.frame(table(unlist(strsplit(Gene, ";")))), Freq > 1)$Var1, collapse = "|"),
Gene
)
)

给出

           Gene Score
1 PNKD;TMBIM1 0.900
2 PNKD 0.200
3 PKHD1 0.500
4 PKHD1 0.600
6 RBMX 0.985
7 RBMX 0.238
9 CASKIN;TRAF7 0.900
10 CASKIN 0.660

关于r - 在 R 的一列中保留数据框中包含相同值的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64177638/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com