- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
前段时间我也做过类似的thread但不幸的是,我在那里使用的方法并没有给我带来任何有希望的结果。我想到了如何以不同的方式做到这一点。所以我来了。
当然示例数据:
structure(list(Name1 = c("Mazda RX4", "Mazda RX4", "KIA Ceed",
"Mazda RX4 Wag", "KIA Ceed", "Valiant", "KIA Classic", "Mazda RX4",
"Dacia", "Merc 280", "Duster 360", "Merc 230"), Name2 = c("Mazda RX4 Wag",
"Merc 230", "KIA Sport", "Merc 230", "KIA Classic", "Merc 230",
"KIA Sport", "Merc 240D", "Mazda RX4 Wag", "Merc 450SE", "Valiant",
"Duster 360")), .Names = c("Name1", "Name2"), class = "data.frame", row.names = c(NA,
12L))
此数据框仅包含两列。原始数据有更多,但这次我将只关注这些列。
只是为了展示我到底想如何对这些人进行聚类,我将输入所需的输出:
structure(list(Name1 = c("Mazda RX4", "Mazda RX4", "KIA Ceed",
"Mazda RX4 Wag", "KIA Ceed", "Valiant", "KIA Classic", "Mazda RX4",
"Dacia", "Merc 280", "Duster 360", "Merc 230"), Name2 = c("Mazda RX4 Wag",
"Merc 230", "KIA Sport", "Merc 230", "KIA Classic", "Merc 230",
"KIA Sport", "Merc 240D", "Mazda RX4 Wag", "Merc 450SE", "Valiant",
"Duster 360"), cluster = c(1, 1, 2, 1, 2, 3, 2, 0, 0, 0, 3, 3
)), .Names = c("Name1", "Name2", "cluster"), row.names = c(NA,
12L), class = "data.frame")
正如您从输出中看到的,我想根据第二列中找到的合作伙伴对汽车进行聚类。因此,如果一行中的汽车在下一列中共享相同的“伙伴”,那么它们应该聚集在一起。
表格形式的外观以及一些解释:
Name1 Name2 cluster
1 Mazda RX4 Mazda RX4 Wag 1 ## Two Mazda's same cluster
2 Mazda RX4 Merc 230 1 ## First Mazda with another partner
3 KIA Ceed KIA Sport 2 ## Ceed together with Sport
4 Mazda RX4 Wag Merc 230 1 ## Second Mazda with the same partner
5 KIA Ceed KIA Classic 2 ## Ceed together with Classic
6 Valiant Merc 230 3
7 KIA Classic KIA Sport 2 ## And of course Classic with Sport
8 Mazda RX4 Merc 240D 0 ## First Mazda with another Merc but can't be clustered together in the cluster number 1 because the second Mazda doesn't share this "partner".
9 Dacia Mazda RX4 Wag 0 ## Similar situation but just second Mazda
10 Merc 280 Merc 450SE 0
11 Duster 360 Valiant 3
12 Merc 230 Duster 360 3
这只是我想要实现的简单示例。当然,根据我的原始数据,可能会出现某些对汽车属于不同集群的成员的情况。簇号可以用逗号分隔,或者如果需要可以创建另一列。对于不能与其他任何东西聚集的对,不必设置 0。它们只能形成单行簇。反正我不会分析。
我希望我能够准确地解释我想要实现的目标。非常欢迎有创意的想法。
当然,我想开始悬赏让我满意的答案,就像我在上一个线程中所做的那样。
最佳答案
根据评论,“我想创建包含至少 3 个不同基因的簇,并且所有这些基因都相互作用。”
这个描述似乎与图论中派系的定义相对应。也就是说,您似乎正在寻找大小为 3 或更大的所有派系。
因此,使用您的示例数据
library(igraph)
g<-graph.data.frame(data,directed=FALSE)
(q<-cliques(g,min=3))
#> [[1]]
#> + 3/12 vertices, named:
#> [1] Mazda RX4 Mazda RX4 Wag Merc 230
#>
#> [[2]]
#> + 3/12 vertices, named:
#> [1] KIA Ceed KIA Classic KIA Sport
#>
#> [[3]]
#> + 3/12 vertices, named:
#> [1] Valiant Duster 360 Merc 230
您认识到任何边都可能属于多个派系,因此我为每个派系创建了一列,并带有一个属于该派系的标志。
ind<-t(apply(data,1,function(r) sapply(q,function(i) all(as.character(r) %in% names(i)))))
(d1<-cbind(data,ind))
Name1 Name2 1 2 31 Mazda RX4 Mazda RX4 Wag TRUE FALSE FALSE2 Mazda RX4 Merc 230 TRUE FALSE FALSE3 KIA Ceed KIA Sport FALSE TRUE FALSE4 Mazda RX4 Wag Merc 230 TRUE FALSE FALSE5 KIA Ceed KIA Classic FALSE TRUE FALSE6 Valiant Merc 230 FALSE FALSE TRUE7 KIA Classic KIA Sport FALSE TRUE FALSE8 Mazda RX4 Merc 240D FALSE FALSE FALSE9 Dacia Mazda RX4 Wag FALSE FALSE FALSE10 Merc 280 Merc 450SE FALSE FALSE FALSE11 Duster 360 Valiant FALSE FALSE TRUE12 Merc 230 Duster 360 FALSE FALSE TRUE
Or, you could present them in a list in each row of the data.frame.
(d2<-cbind(data,clique=I(as.list(apply(ind,1,which)))))
Name1 Name2 clique1 Mazda RX4 Mazda RX4 Wag 12 Mazda RX4 Merc 230 13 KIA Ceed KIA Sport 24 Mazda RX4 Wag Merc 230 15 KIA Ceed KIA Classic 26 Valiant Merc 230 37 KIA Classic KIA Sport 28 Mazda RX4 Merc 240D 9 Dacia Mazda RX4 Wag 10 Merc 280 Merc 450SE 11 Duster 360 Valiant 312 Merc 230 Duster 360 3
关于r - 基于 "partnership"构建集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32071892/
我在使用 gradle 构建一个特定应用程序时遇到问题。该应用程序可以用 eclipse 编译和构建,它在平板电脑上运行良好。当我尝试使用 Gradle 构建它时,“compileDebugJava”
我有一个 C 程序,是一位离开的开发人员留给我的。我试图弄清楚他到底在做什么,并将软件重新安排成更合乎逻辑的东西,这样我就可以更轻松地构建它。我正在使用 CMake 构建,而他使用的是 Make。 有
我刚开始阅读“Pro Spring MVC with web flow”,它附带了一个我想遵循的代码示例。 我要什么 - 我想像书中那样构建应用程序,使用 Gradle 有什么问题 - 我没用过 Gr
我希望有人已经这样做了。我正在尝试为我的一个 angular 2 项目在 teamcity 中建立一个连续的构建。在做了一些研究之后,我按照以下步骤操作: 构建步骤 1:为 teamcity 安装 j
我有一个旧的 ASP.Net 网站解决方案,看起来像: 当我在 Visual Studio 中构建解决方案时,我得到以下输出: ------ Build started: Project: C:\..
我使用 gulp-usref、gulp-if、gulp-uglify、gulp-csso 和 gulp-file-include 来构建我的应用程序。除了 HTML 保持原样外,构建中的一切都运行良好
我正在使用 ionic2 开发内部移动应用程序。我可以通过以下方式成功构建 ios: ionic build ios and ionic build ios --prod 但当我这样做时,它一直失败
我是一位经验丰富的 .NET/C# 开发人员,但对这里的几乎所有技术/库(包括 SQL/DB 工作)都是新手。 我正在开发一个具有 Azure/Entity Framework .NET 后端和可移植
我正在使用 VS 2008。我可以使用 IDE 成功编译我的解决方案。但是,当我尝试使用 devenv.com 构建它时,它失败并提示“错误:找不到项目输出组'(无法确定名称)的输出”。该组、其配置或
版本: ember.js 2.7,ember-data 2.7 ember-cli 2.9.1//同样适用于 ember-cli 2.7 node 6.9.1, npm 3.10.9//也适用于 no
我第一次修补 AzureDevops,设置一些 CI 任务。 我有一个公共(public)存储库(开源)和一个包含 3 个 F# 项目的解决方案(.sln)。该解决方案在 Windows/Mac/Li
目前 5.1.5 版本或 STLPort CVS 存储库似乎仍不支持 VS2008。如果有人已经完成了这项工作,那么如果可能的话,分享会很有用:) 同样,了解 VS2005 或 2008 x64 构建
我有一个 Python 2.7 项目,到目前为止一直使用 gfortran 和 MinGW 来构建扩展。我使用 MinGW,因为它似乎支持 Fortran 代码中的写入语句和可分配数组,而 MSVC
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
我想知道为什么在 Zimbra Wiki 中只列出了构建过程的特定平台。这意味着不可能在其他 Linux 发行版上构建 Zimbra? Zimbra 社区选择一个特殊的 Linux 发行版来构建 Zi
我将在 Swift 中构建一个 CLI 工具。我用这个命令创建了项目 swift package init --type executable当我构建我的项目并解析 时读取别名 Xcode 中的参数并
我想为添加到 docker 镜像的文件设置文件权限。我有这个简单的 Dockerfile: FROM ubuntu:utopic WORKDIR /app RUN groupadd -g 1000 b
当我使用 clBuildProgram在我的 OpenCl 代码中,它失败并显示错误代码 -11,没有任何日志信息。 这是我的代码的样子: ret = clBuildProgram(program
我有一个底部导航栏,它有一个列表页面,该页面使用状态块。 class _MainPageState extends State { int _index = 0; @override Wi
我在本地计算机上使用Jenkins(Jenkins URL未通过Internet公开,但该计算机上已启用Internet。) 我进行了以下配置更改: 在Jenkins工具上安装了Git和Github插
我是一名优秀的程序员,十分优秀!