R 计算数据帧或数组中相邻相同值的数量-6ren

R 计算数据帧或数组中相邻相同值的数量

转载作者：行者123 更新时间：2023-12-04 20:43:38

25

4

我有一个来自河流底部的分类基质尺寸数据集。由于我收集数据的方式，我可以在空间上将它们排列成一个矩阵，其中保留了它们与邻居的关系(即，左侧、前面等)。一个示例如下所示:

     P.1 P.2 P.3 P.4 P.5
T 1    G   C   C   P   C
T 2    P   C   B   G   C
T 3   SI  SI   C   B   C
T 4   SI  BR  BR  SI  SI
T 5   BR  CL  BR  BR   B
T 6   BR  BR  BR  BR   C

其中 P(n) 是从左到右横穿河流的横断面上的实际点测量值，T(n) 给出从上游到下游的横断面。如您所见，某些基质类型(特别是本示例中的基岩“BR”)具有比其他基质更大的相邻斑块。这在生态上是有意义的，而且可能不仅仅是样本中 BR 的百分比。

我的问题是:是否有一种简单的方法可以计算彼此相邻的相同类型的基板测量值的数量？请注意，角相邻也被认为是相邻的。

编辑以下非常有用的评论:

示例输出将是每种类型补丁的列表，以及每个补丁中的测量数量。它可能看起来像这样:

$BR  
[1] 9  

$B  
[1] 1 1  

$C  
[1] 4 3 1  

$P  
[1] 1 1  

$G  
[1] 1 1  

$SI  
[1] 3 2

最佳答案

一个有趣的小问题。我附上了一个解决方案，它应该适用于任何因素矩阵。它正在使用 foreach和 data.table包，所以你可能想要安装它们。

它的工作原理是首先堆叠数据并将每个位置映射到一个值。然后它遍历原始矩阵，对邻居进行贪婪的自递归，但首先从堆叠矩阵中删除自己(避免多次计算自己)。

我不喜欢这个解决方案中的一些 for 循环，但考虑到与堆叠框架交互的加速，我没有看到一个简单的方法来解决它而不完全重新工作。更好的实现是使用像 synchronicity 这样的包在并行线程中运行它(可能通过补丁类型而不是位置)。在堆叠数据周围放置一个互斥锁(有人吗？)。
dcast在 reshape2 package 也是创建堆叠框架的好选择。

对于这个矩阵:

> d
    P-1 P-2 P-3 P-4 P-5 P-6
T-1   G   P  SI  SI  BR  BR
T-2   C   C  SI  BR  CL  BR
T-3   C   B   C  BR  BR  BR
T-4   P   G   B  SI  BR  BR
T-5   C   C   C  SI   B   C

它给出了以下结果(看起来像你所要求的):

> patchesList
$G
[1] 1 1
$C
[1] 4 3 1
$P
[1] 1 1
$B
[1] 2 1
$SI
[1] 3 2
$BR
[1] 9
$CL
[1] 1

数据设置代码:

rm(list=ls())
d = strsplit("G   C   C   P   C P   C   B   G   C SI  SI   C   B   C SI  BR  BR  SI  SI BR  CL  BR  BR   B BR  BR  BR  BR   C"," ")[[1]]
d=d[-which(d=="")]
d=data.frame(matrix(d,nrow=5),stringsAsFactors=F)
rownames(d) = paste("T",1:5,sep="-")
colnames(d) = paste("P",1:6,sep="-")
levs = unique(unlist(d))

堆叠原始数据(带有位置信息):

idxsFrame = expand.grid(1:nrow(d),1:ncol(d))
colnames(idxsFrame) = c("ri","cj")
idxsFrame$value = apply(idxsFrame,1,function(x) { d[x[["ri"]],x[["cj"]]] } )
require(data.table)
idxsFrame = data.table(idxsFrame)

设置输出列表:

patchesList = vector(mode="list",length=length(levs))
names(patchesList) = levs 
require(foreach)

进行扫描的自递归函数:

scanSurroundTiles = function(tile) 
{  
  surroundTiles = idxsFrame[ri>=(tile$ri-1) & ri <=(tile$ri+1) & cj>=(tile$cj-1) & cj<=(tile$cj+1),,drop=F]
  baseMatches = surroundTiles[which(surroundTiles$value == tile$value),,drop=F]  
  if(nrow(baseMatches) < 1) 
    return(tile)
  else
  {
    # not possible to do an apply(matches,1,scanSurroundTiles) because of overlap and self-recursiveness on deeper levels
    newMatches <- foreach(mc = 1:nrow(baseMatches), .combine=rbind) %do% # mc = 2; 
    {
      inIdxs = which(idxsFrame$ri==baseMatches$ri[mc] & idxsFrame$cj==baseMatches$cj[mc])
      if(length(inIdxs)>0)
      { assign("idxsFrame",idxsFrame[-inIdxs,,drop=F],globalenv()) 
        return(scanSurroundTiles(baseMatches[mc,,drop=F]))      
      } else
      { return(NULL) } # could have been removed from previous foreach 
    }
    return(rbind(tile,newMatches))
  }
}

主循环:

for(i in 1:nrow(d))  
{
  for(j in 1:ncol(d)) 
  { 
    sourceTile = idxsFrame[ri==i & cj==j,,drop=F]
    if(nrow(sourceTile) > 0)
    {
      idxsFrame <- idxsFrame[-which(idxsFrame$ri==sourceTile$ri & idxsFrame$cj==sourceTile$cj),,drop=F]
      thisPatch = scanSurroundTiles(sourceTile)
# if you want to do some calc by patch (mean, sd) this is the place to do it by adding other info beyond the type in the stacked frame
      patchesList[[thisPatch$value[1]]] = c(patchesList[[thisPatch$value[1]]],nrow(thisPatch))      
    }  
  }
}

关于R 计算数据帧或数组中相邻相同值的数量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21537439/

25

4

0

文章推荐： r - 使用降雪进行并行计算时为什么不进行负载平衡？

文章推荐： barcode - ZXing:寻找条码的边界矩形

文章推荐： r - knitr 2 wordpress(发送标题无内容)

python - 相邻/连接元素数组
我想在数组中找到连接(相邻)的元素。例如，在数组中: [1,2,3,4,5] 要访问所有 2 个连通元素，输出将为: 1,2 2,3 3,4 4,5 要访问所有 3 个连通元素，输出将为 1,2,3
flash - 相邻 Sprite 上的矩阵变换导致子像素间隙
我有三个 Sprite ，彼此堆叠在一起。我修改了他们的 transform.matrix 以给出他们一致增长的外观。但是，根据比例因子，瓷砖之间有时会出现小裂缝。 cracks between
css - 相邻 sibling 的边距折叠
我正在阅读有关 Margin Collapsing 的文章，我遇到了这个:margin Adjacent siblings The margins of adjacent siblings are c
html - 相邻 float 框的框阴影被切断
float div 的框阴影被其右侧的邻居截断，但左侧未截断。我玩过 z-index 和 overflow: visible，但没有用。 HTML: CSS: .doc-page {
html - 相邻 flexbox 容器中内容的垂直对齐
我有多个元素说卡片。这些卡片需要水平堆叠并且高度需要相同。这正在发生在我身上。每张卡片都有图像、文本和按钮。每张卡片的图像和文本应采用任何卡片中的最大高度，以便它们正确对齐。这不会发生在我身上。如
Java:GridBagLayout 相邻 x 网格之间不需要的间距
我有这个 GUI 我使用了 GridBagLayout，但我不知道为什么 Plain Bread 复选框与其相应的标签之间有很大的间距。而且，我尝试仅增加按钮沿 x 轴的间距，但尽管重置了插图，但沿
css - 列表项背景图像 - 相邻 float 内容重叠
在过去，我已经为自定义元素符号使用了数百次列表项背景图像，但不知何故从未遇到过这个问题。基本上，我有一个 IMG float 在无序列表的左侧。元素符号背景图像设置在每个 LI 的左上角。但是， f
html - 匹配空 div 的高度(相邻)
我正在使用 Bootstrap 框架并使用 2 列网格。 html 内容有标题、链接、副标题和文本。这增加了该列的高度。我希望它旁边的列与其高度匹配(以便图像显示)没有设置高度图像不显
php - !important 相邻的边框颜色
我有一个 php 代码可以生成数百个和标签。我的问题如下，我有以下内容: X X 我想要第二个的边框颜色更重要，以便共享边框显示为灰色而不是黑色。我可以在第二个 td 中使用重要性或继承标签吗？
css - 一般 "previous"相邻 (+) 兄弟不工作
Place holder for Radio1 Place holder for Radio2 在此，我只想要与相应的单选按钮相关联是可见的，但是...... * { visibilit
html - 两个 div 相邻，一个有上边距
我正在尝试在 html 中实现以下布局。更大的 div 1。然后是它旁边的另一个 div，顶部有一个边距。如果我给 float: left 给第一个 div，给第二个 div margin-top 也
c - 将字段中的位扩展到掩码中所有(重叠+相邻)设置位的最快方法？
假设我有 2 个名为 IN 和 MASK 的二进制输入。实际字段大小可能是 32 到 256 位，具体取决于用于完成任务的指令集。两个输入都会改变每次调用。 Inputs: IN = ...110
haskell - 将列表的(相邻)元素打包成 2 元组的方法
我想知道是否有一种简洁/一行的方法来执行以下操作: pack :: [a] -> [(a, a)] pack [] = [] pack [_] = [] pack (x:y:xs
javascript - React.js 上的 JSX 相邻
下面的代码分为两部分，一部分处理头部的管理，另一部分处理“主体”，当我执行代码时引发下面的异常，我该如何解决该错误？我不知道下面的错误是什么原因造成的，错误是在react的解析上错误: Line
html - 如何让我的 div 与父容器中的另一个 div 相邻？
http://imgur.com/a/DA5i4 在上面的两张图片中你可以看到我有一个主容器，里面装满了 3 个较小的 div，一个大的在中间，两个瘦的在两边，但是右边直到中间的 div 下面才开始。
html - 我怎样才能使 div 与其他 div 相邻，但像屏幕截图中那样将它们保持在原位
正如我在标题中解释的所有内容，然后我将只为你们提供我现在拥有的代码，我一直在努力实现我想要的东西很长时间但没有运气......它表现得像响应式的，但即使调整大小我也想将其保持在原位...截图
javascript - 相邻 HTML div 中的两个 float 图表导致问题
我编写了一个 jquery 插件，它使用 Flot 将 HTML 表格转换为图表。 HTML 是从 XSLT 生成的，在 XSLT 中我有以下代码来调用我的插件。此代码尝试在 blah1 和 blah
css - 如何使用 CSS 将一组较小的 DIVS 与一个大的 DIVS 相邻
我正在尝试实现这样的布局。 aaa xxxxxx oooo aaa xxxxxx oooo xxxxxx xxxxxx bbb xxxxxx cccc bbb xxxxxx cc
css - 如何使 jqgrid 显示与另一个 jqgrid 或只是一个 div 相邻？
在包含网格的 2 个 div 上使用内联 css 显示不起作用最佳答案为您的 div 指定宽度并根据您的要求使用“float: left”或“right”。不要对 div 使用“内联” 例如 CS
javascript - 从 MVC 返回时如何忽略 ' 符号。 document.insert 相邻
我将 MVC 项目中的一些代码返回到网页。我无法用撇号解决问题，当我的电话看起来像这样时，我如何忽略它 document.getElementById('some').insertAdjacentHT

首页

博学

6Ren·AI

商城

R 计算数据帧或数组中相邻相同值的数量