- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我面临一个问题,我必须将各种分组索引连接成一个。这是一个例子:
df <- data.frame(idx1 = c("1_1","1_1","1_2","1_3","1_4","1_4","1_5","1_6","1_6"),
idx2 = c("2_1","2_2","2_2","2_3","2_4","2_5","2_6","2_7","2_8"),
idx3 = c("3_1","3_1","3_2","3_3","3_3","3_5","3_6","3_7","3_8"))
idx1 idx2 idx3
1 1_1 2_1 3_1
2 1_1 2_2 3_1
3 1_2 2_2 3_2
4 1_3 2_3 3_3
5 1_4 2_4 3_3
6 1_4 2_5 3_5
7 1_5 2_6 3_6
8 1_6 2_7 3_7
9 1_6 2_8 3_8
每个索引表示使用不同方法检测到的重复行。我想创建一个连接三者的索引。例如,idx1
表示第1行和第2行相同,idx2
表示第2行和第3行相同,所以第1、2、3行相同,应该具有相同的分组索引。
第 4 行和第 5 行具有相同的 idx3
分组索引,第 5 行和第 6 行具有相同的 idx1
,因此它们应该具有相同的分组索引,与第 1 行不同, 2 和 3。
我确实设法编写了一个循环来创建连接索引:
df$I <- seq(df$idx1)
df$doublon_idx <- as.numeric(NA)
idx_cnt <- 1
for(i in 1:dim(df)[1]){
if(is.na(df[i,"doublon_idx"])){
df[i,"doublon_idx" ] <- idx_cnt
idx_cnt <- idx_cnt + 1
}
df[df$I != i & df$idx1 == df[i,]$idx1,"doublon_idx"] <- df[i,"doublon_idx"]
df[df$I != i & df$idx2 == df[i,]$idx2,"doublon_idx"] <- df[i,"doublon_idx"]
df[df$I != i & df$idx3 == df[i,]$idx3,"doublon_idx"] <- df[i,"doublon_idx"]
}
(预期的)输出是:
idx1 idx2 idx3 I doublon_idx
1 1_1 2_1 3_1 1 1
2 1_1 2_2 3_1 2 1
3 1_2 2_2 3_2 3 1
4 1_3 2_3 3_3 4 2
5 1_4 2_4 3_3 5 2
6 1_4 2_5 3_5 6 2
7 1_5 2_6 3_6 7 3
8 1_6 2_7 3_7 8 4
9 1_6 2_8 3_8 9 4
但我对此并不满意:它不是通用的,它使用循环,所以当表变大时速度很慢。我确信有一种合并的方式,或者是一种我没有找到的聪明的方式。你的是什么?是否可以推广到任意数量的分组索引?
dplyr
和 data.table
是受欢迎的(尽管我更喜欢 data.table
如果你可以两者都做的话)
最佳答案
不确定这对您的实际数据集有多快。下面是结合 igraph
和 data.table
的方法:
library(data.table)
setDT(df)[, rn := .I]
#create edges and idx* are your vertices
DT <- rbindlist(list(
df[, .(s=idx1, e=idx2, rn)],
df[, .(s=idx1, e=idx3, rn)],
df[, .(s=idx2, e=idx3, rn)]))
#find linked clusters
library(igraph)
g <- graph_from_data_frame(DT, directed=FALSE)
cl <- clusters(g)$membership))
#look up cluster for each vertex
DT[, g := cl[s]]
#look up grouping for each vertex
df[unique(DT, by="rn"), on=.(rn), doublon_idx := g]
例如输出1:
idx1 idx2 idx3 rn doublon_idx
1: 1_1 2_1 3_1 1 1
2: 1_1 2_2 3_1 2 1
3: 1_2 2_2 3_2 3 1
4: 1_3 2_3 3_3 4 2
5: 1_4 2_4 3_3 5 2
6: 1_4 2_5 3_5 6 2
7: 1_5 2_6 3_6 7 3
8: 1_6 2_7 3_7 8 4
9: 1_6 2_8 3_8 9 4
例如输出2:
idx1 idx2 idx3 rn doublon_idx
1: 1_1 2_1 3_1 1 1
2: 1_1 2_2 3_1 2 1
3: 1_2 2_2 3_2 3 1
4: 1_3 2_3 3_3 4 2
5: 1_4 2_4 3_3 5 2
6: 1_4 2_5 3_5 6 2
7: 1_5 2_6 3_6 7 3
8: 1_6 2_7 3_7 8 4
9: 1_6 2_8 3_8 9 4
关于r - 将多个分组索引连接成一个,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61528131/
我正在尝试读取和处理一个大的 json 文件(~16G),但即使我通过指定 chunksize=500 读取小块,它仍然有内存错误。我的代码: i=0 header = True for chunk
请看下图... 我想通过 CSS 实现。 我现在将此分隔符用作在我的容器内响应的图像 ( jpg )。问题是我似乎无法准确匹配颜色或使白色晶莹剔透。 我认为 CSS 是解决这个问题的最佳方式。 尺寸为
所以我正在尝试使用 AngularJS 和 Node.js。我正在尝试设置客户端路由,但遇到一些问题。 编辑 所以我改变了一些代码如下 https://github.com/scotch-io/sta
我想创建如下图所示的边框: 这段代码是我写的 Some Text p{ -webkit-transform: perspective(158px) rotateX(338deg); -webk
好的,所以我有一个包含 2 个选项的选择表 $builder->add('type', 'choice', array( 'label' => 'User type', 'choice
我的代码: private void pictureBox1_MouseDown(object sender, MouseEventArgs e) { ngr.
我正在尝试编写 Tic-Tac-Toe 游戏代码,但不知道如何在轮到我时push_back '+' 字符。 因此,每当玩家输入例如“Oben 链接”时,这基本上意味着左上角,我希望游戏检查输入是否正确
我正在研究 HtmlHelper.AnonymousObjectToHtmlAttributes。 它适用于匿名对象: var test = new {@class = "aaa", placehol
在 stackoverflow 上所有这些 mod 重写主题之后,我仍然没有找到我的问题的答案。我有一个顶级站点,基本上我想做的就是将 /index.php?method=in&cat=Half+Li
仅使用 CSS 可以实现此功能区吗? 最佳答案 .box { width: 300px; height: 300px; background-color: #a0a0a0;
我有一个 jbuilder 模板,它用 json 表示我的一个模型,如下所示: json.(model, :id, :field1, :field2, :url) 如果我只是从控制台访问该字段,则 u
昨天我问了一个问题 - Draw arrow according to path 在那个问题中,我解释说我想在 onTouchEvent 的方向上绘制一个箭头。我在评论中得到了答案,说我应该旋转 Ca
我希望段落中的代码与代码块中显示的代码一致。 例如: The formula method for a linear model is lm(y~x, data = dat). For our da
我使用 ViewPager 获得了一个选项卡菜单。每个选项卡都包含来自 android.support.v4 包的 fragment (与旧 SDK 的兼容性)。其中一个 fragment 是 Web
我正在从事一项需要多种程序能力的科学项目。在四处寻找可用的工具后,我决定使用 Boost 库,它为我提供了 C++ 标准库不提供的所需功能,例如日期/时间管理等。 我的项目是一组命令行,用于处理来自旧
外媒 Windows Latest 报道,随着 Windows 10 的不断发展,某些功能会随着新功能的更新而被抛弃或成为可选项。早在 2018 年,微软就确认截图工具将消失,现代的 “截图和草图”
我有标记的 Angular ,我只希望标记旋转到那个 Angular 。 marker = new google.maps.Marker({ position: myL
我一定是遗漏了什么,但我不知道是什么。我有使用 polymer 实现的简单自定义元素: TECK ..
我有一个关于如何设置我们产品的分步教程。我必须在每个步骤中显示大量示例代码。以下是我必须在页面中显示的代码类型列表。我用什么来格式化所有内容? Java 代码示例 XML 样本 iOS SDK 文件(
我需要在我的 iPad 应用程序中绘制一些图表,所以我遵循了本教程: http://recycled-parts.blogspot.com/2011/07/setting-up-coreplot-in
我是一名优秀的程序员,十分优秀!