r - 有效地折叠矩阵-6ren

r - 有效地折叠矩阵

转载作者：行者123 更新时间：2023-12-05 00:18:20

26

4

我有一个这种格式的矩阵:

set.seed(1)
mat <- matrix(round(runif(25,0,1)),nrow=5,ncol=5)
colnames(mat) <- c("a1::C","a1::A","a1::B","b1::D","b1::A")

     a1::C a1::A a1::B b1::D b1::A
[1,]     0     1     0     0     1
[2,]     0     1     0     1     0
[3,]     1     1     1     1     1
[4,]     1     1     0     0     0
[5,]     0     0     1     1     0

换句话说，每一列都是一个主题和一个特征(由列名表示，它们之间用::分隔)。在每一行中，值为 1 表示主题具有该特征，如果没有，则值为 0。对于特定行，某个主题的所有列中可能都有 0。

我想构建一个新矩阵，其中列将是主题(即每个主题一列)，并且在行中，该主题具有的特征将按字母顺序排序并以昏迷分隔。如果某个主题没有任何特征(即，该主题的某一行全部为 0)，则应使用值“W”(所有特征都没有值“W”)。

这是基于 mat 的新矩阵看起来像:

cnames = unique(sapply(colnames(mat), function(x) strsplit(x,split="::")[[1]][1]))
new_mat <- matrix(c("A","A","A,B,C","A,C","B",
                    "A","D","A,D","W","D"),
                  nrow=nrow(mat),ncol=length(cnames))
colnames(new_mat) = cnames

     a1      b1   
[1,] "A"     "A"  
[2,] "A"     "D"  
[3,] "A,B,C" "A,D"
[4,] "A,C"   "W"  
[5,] "B"     "D"

知道什么是实现这一目标的有效而优雅的方式吗？

最佳答案

第 1 步:矩阵列旋转

mat <- mat[, order(colnames(mat))]

#      a1::A a1::B a1::C b1::A b1::D
# [1,]     1     0     0     1     0
# [2,]     1     0     0     0     1
# [3,]     1     1     1     1     1
# [4,]     1     0     1     0     0
# [5,]     0     1     0     0     1

步骤2.1:列名分解

## decompose levels, get main levels (before ::) and sub levels (post ::)
decom <- strsplit(colnames(mat), "::")

main_levels <- sapply(decom, "[", 1)
# [1] "a1" "a1" "a1" "b1" "b1"

sub_levels <- sapply(decom, "[", 2)
# [1] "A" "B" "C" "A" "D"

步骤 2.2:分组索引生成

## generating grouping index
main_index <- paste(rep(main_levels, each = nrow(mat)), rep(1:nrow(mat), times = ncol(mat)), sep = "#")
sub_index <- rep(sub_levels, each = nrow(mat))
sub_index[!as.logical(mat)] <- ""  ## 0 values in mat implies ""

## in unclear of what "main_index" and "sub_index" are, check:

## matrix(main_index, nrow(mat))
#      [,1]   [,2]   [,3]   [,4]   [,5]  
# [1,] "a1#1" "a1#1" "a1#1" "b1#1" "b1#1"
# [2,] "a1#2" "a1#2" "a1#2" "b1#2" "b1#2"
# [3,] "a1#3" "a1#3" "a1#3" "b1#3" "b1#3"
# [4,] "a1#4" "a1#4" "a1#4" "b1#4" "b1#4"
# [5,] "a1#5" "a1#5" "a1#5" "b1#5" "b1#5"

## matrix(sub_index, nrow(mat))
#      [,1] [,2] [,3] [,4] [,5]
# [1,] "A"  ""   ""   "A"  ""  
# [2,] "A"  ""   ""   ""   "D" 
# [3,] "A"  "B"  "C"  "A"  "D" 
# [4,] "A"  ""   "C"  ""   ""  
# [5,] ""   "B"  ""   ""   "D"

步骤 2.3:条件折叠粘贴

## collapsed paste of "sub_index" conditional on "main_index"
x <- unname(tapply(sub_index, main_index, paste0, collapse = ""))
x[x == ""] <- "W"
# [1] "A"   "A"   "ABC" "AC"  "B"   "A"   "D"   "AD"  "W"   "D"

第 3 步:后处理

我对此不太满意，但没有找到替代方案。

x <- sapply(strsplit(x, ""), paste0, collapse = ",")
#  [1] "A"   "A"   "A,B,C"  "A,C"   "B"   "A"   "D"   "A,D"  "W"  "D"

第 4 步:矩阵

x <- matrix(x, nrow = nrow(mat))
colnames(x) <- unique(main_levels)

#      a1      b1   
# [1,] "A"     "A"  
# [2,] "A"     "D"  
# [3,] "A,B,C" "A,D"
# [4,] "A,C"   "W"  
# [5,] "B"     "D"

效率考量

该方法本身使用矢量化非常有效，并且不需要手动输入分组信息。例如，您可以使用相同的代码，即使您有数百个主组(之前::)和数百个子组(后::)。

唯一的考虑是减少不必要的内存副本。在这方面，我们应该尽可能使用匿名函数，而不是像上面演示的那样显式分配矩阵。这会很好(已经测试过):

 decom <- strsplit(sort(colnames(mat)), "::")
 main_levels <- sapply(decom, "[", 1)

 sub_index <- rep(sapply(decom, "[", 2), each = nrow(mat))
 sub_index[!as.logical(mat[, order(colnames(mat))])] <- ""

 x <- unname(tapply(sub_index,
                    paste(rep(main_levels, each = nrow(mat)),
                          rep(1:nrow(mat), times = ncol(mat)),
                          sep = "#"),
                    paste0, collapse = ""))

 x <- matrix(sapply(strsplit(x, ""), paste0, collapse = ","),
             nrow = nrow(mat))

 colnames(x) <- unique(main_levels)

关于r - 有效地折叠矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38022568/

26

4

0

文章推荐： DataFrames.jl 行数

文章推荐： android - 如何在 Android 中以编程方式获取 "CompileSdkversion"

文章推荐： f# - 如何设置 Visual Studio 代码 launch.json 文件以调试 F#？

javascript - Aptana 折叠/折叠 javascript 代码
我需要能够在我的 javascript 中折叠/折叠各种代码片段，有点像 C# 中的#region #endregion。我找不到执行此操作的方法，有什么帮助吗？最佳答案窗口菜单 -> 选择首选项
javascript - 折叠 Accordion 时，边框会在此期间消失，折叠 Accordion 时边框如何可见？
折叠 Accordion 时，我注意到在这段时间内没有显示边框。例如，当 Accordion 展开时，我们会在展开时看到边界。这也可以在折叠 Accordion 时完成吗？ Accordion 折叠时
sublimetext2 - 折叠/折叠 sublime text 2 中的异常(exception)代码部分
是否有任何插件或快捷方式可以隐藏 Sublime Text 2 中除代码部分之外的所有内容？我需要一次折叠除部分之外的所有部分，而不是一次折叠一个部分。谢谢~ 最佳答案如果将鼠标悬停在行号上，您
scala - 折叠\/[A,A] 到 A
在 Web 应用程序中，我有一个操作可能会以各种不同的方式失败，或者最终会成功。在这种情况下，成功和失败由 SimpleResult 的子类表示(表示 HTTP 响应) 我使用 scalaz/上的
vba - 折叠/展开部分中的行
我的数据在这样的分组方案中分为三个连续的类别: 因此，整个“OCM”组被分解为名为“N/A”、“Financials”、“Industrials”等的子组，每个子组又被分解为进一步的子组。我在 Ex
scala - 折叠 NonEmptyList
我正在尝试猫图书馆，但我很难在我应该导入和创建的东西之间导航。我的问题如下: sealed trait Checks case class CheckViolation(id: Long, msg:
Vim 折叠 - 标记打开的折叠
有没有办法查看当前文件中打开的折叠位置？我个人在打开折叠和移动时遇到问题，我无法找到折叠开始的线!也许有一个选项可以在数字旁边设置一个漂亮的折叠提示。也许是这样的: + 1 void myfunc(
基于空白深度的 Notepad++ 折叠
我正在寻找一种按空白深度折叠纯文本的方法。我更喜欢 Notepad++ 解决方案，但如果它只能在另一个编辑器中完成，我可以处理。例如 Header is arbitrary text Child i
jsTree 节点展开/折叠
今天早上我遇到了优秀的 jstree jQuery UI 插件。一句话——太棒了!它易于使用，易于样式化，并且可以按照包装盒上的说明进行操作。我还没有弄清楚的一件事是 - 在我的应用程序中，我想确
wpf - 折叠/展开组框
我有以下XAML，其中堆叠了三个组框。这些组框的标题中是复选框。我想要实现的是:当我选中/取消选中一个框时，我希望相应的groupbox能够以平滑的动画缓慢展开/折叠。我正在Blend 4中尝试此
Vim 折叠 - 在光标下递归关闭所有子项
我知道如何使用 zO 打开光标下的所有折叠. 但是反向怎么做呢？我想要类似 za 的东西确实如此，但也具有递归性。附注。我知道有 zC ，但它会关闭与当前行相关的所有父级折叠，我想关闭子级。最佳
jquery - 如何防止导航栏在单击具有下拉类的特定菜单项时隐藏/折叠？
我试图防止点击 About Us 时导航栏崩溃部分或 Projects以下代码中的部分。我已经尝试过event.stopPropagation()在这两个按钮上，但是当 jQuery 代码执行时，导航
wpf - 我需要对RowDetailsTemplate进行扩展/折叠
我有一个DataGrid。它具有DataGrid.RowDetailsTemplate。当单击一个按钮时，它应该展开/折叠；我该怎么做？
wpf - 使用XAML完成Storyboard时将元素的可见性设置为“折叠”
我有一个 Storyboard动画，使用Opacity属性可以使控件淡出 View 。完成后，我想将控件的“可见性”设置为“折叠”。我也想做相反的事情...将“可见性”设置为“可见”，然后使用 St
SublimeText3 折叠/展开所有方法
我将 SublimeText3 用于 C++ 和 Java。我想知道是否有办法折叠文件/类中的所有方法，然后将它们全部展开，而不管插入符号在哪里。或者有没有办法列出所有的功能/方法。基本上我希望能够
没有空格的 YAML 折叠
如何在 YAML 中断开长字符串(如长 url 或文件名/路径)，而不会将换行符变成空格？示例输入: url: > https://example.com/?what=Lorem %20ip
scala - 折叠 HList？
给定: import shapeless._ case class F(x: Option[Int], y: Option[Int]) 我想帮忙写一个函数，f: def f(Option[Int]::
JavaScript:在reduce方法中引用剩余的数组(折叠)？
我想测试数组是否仅包含唯一元素，我的解决方案如下: function uniqueElements(a) { var r = true; while (a) { var [el, a]
javascript - HTML制作菜单展开/折叠
我试图在单击“项目”按钮时使“javascript 项目”和“CGI 项目”滑动切换。但是，我不太明白为什么点击时只有CGI项目按钮切换，而javascript项目按钮保持不变？我正在尝试使用 Jq
javascript - 单击标题时动态展开/折叠
我有一组需要在 UI 中显示的项目，例如标题和其下的项目列表。有一个父组件，我将在其中将此数据传递到如下所示的文件. 在此基础上显示了父子布局。现在我需要根据标题的点击展开/折叠。有一个可以附加

首页

博学

6Ren·AI

商城

r - 有效地折叠矩阵