gpt4 book ai didi

r - 如何在 R 中一次删除多列的单个列中的重复值

转载 作者:行者123 更新时间:2023-11-30 09:27:08 24 4
gpt4 key购买 nike

Sample data

           sessionid             qf      Office
12 3 LON1,LON2,LON1,SEA2,SEA3,SEA3,SEA3
12 4 DEL2,DEL1,LON1,DEL1
13 5 MAn1,LON1,DEL1,LON1

在这里,我想删除每行“OFFICE”列中的重复值。

Expected Output

            sessionid             qf      Office
12 3 LON1,LON2,SEA2,SEA3
12 4 DEL2,DEL1,LON1
13 5 MAN1,LON1,DEL1

最佳答案

这是一种基本的 R 方法,它的工作方式如您所料,首先用逗号分隔 Office,删除重复项,然后再次粘贴回一起

df$Office <- sapply(lapply(strsplit(df$Office, ","),
function(x) {
unique(x)
}),
function(x) {
paste(x, collapse = ",")
},
simplify = T)

或与%>%

df$Office <-  df$Office %>%
strsplit(",") %>%
lapply(function(x){unique(x)}) %>%
sapply(function(x){paste(x,collapse = ",")},simplify = T)

关于r - 如何在 R 中一次删除多列的单个列中的重复值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46568280/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com