gpt4 book ai didi

r - R中列表中相交向量的并集

转载 作者:行者123 更新时间:2023-12-03 15:07:15 24 4
gpt4 key购买 nike

我有一个向量列表,如下。

data <- list(v1=c("a", "b", "c"), v2=c("g", "h", "k"), 
v3=c("c", "d"), v4=c("n", "a"), v5=c("h", "i"))


我正在努力实现以下目标

1)检查向量是否彼此相交。

2)如果找到相交的向量,则求和。

所以所需的输出是

out <- list(v1=c("a", "b", "c", "d", "n"), v2=c("g", "h", "k", "i"))


我可以得到一组相交集的并集,如下所示。

 Reduce(union, list(data[[1]], data[[3]], data[[4]]))
Reduce(union, list(data[[2]], data[[5]])


如何首先确定相交的向量?有没有一种方法可以将列表划分为相交矢量组的列表?

更新资料

这是使用data.table的尝试。获得所需的结果。但是对于大型列表,如在此 example数据集中,仍然很慢。

datasets. 
data <- sapply(data, function(x) paste(x, collapse=", "))
data <- as.data.frame(data, stringsAsFactors = F)

repeat {
M <- nrow(data)
data <- data.table( data , key = "data" )
data <- data[ , list(dataelement = unique(unlist(strsplit(data , ", " )))), by = list(data)]
data <- data.table(data , key = "dataelement" )
data <- data[, list(data = paste0(sort(unique(unlist(strsplit(data, split=", ")))), collapse=", ")), by = "dataelement"]
data$dataelement <- NULL
data <- unique(data)
N <- nrow(data)
if (M == N)
break
}

data <- strsplit(as.character(data$data) , "," )

最佳答案

这有点像图问题,所以我喜欢使用igraph库,使用您的示例数据,您可以

library(igraph)
#build edgelist
el <- do.call("rbind",lapply(data, embed, 2))
#make a graph
gg <- graph.edgelist(el, directed=F)
#partition the graph into disjoint sets
split(V(gg)$name, clusters(gg)$membership)

# $`1`
# [1] "b" "a" "c" "d" "n"
#
# $`2`
# [1] "h" "g" "k" "i"


我们可以用

V(gg)$color=c("green","purple")[clusters(gg)$membership]
plot(gg)

关于r - R中列表中相交向量的并集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27520310/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com