r - 泛化R％in％运算符以匹配元组-6ren

r - 泛化R％in％运算符以匹配元组

转载作者：行者123 更新时间：2023-12-04 08:25:31

27

4

前几天，我花了一段时间寻找一种检查R中某些行向量中是否包含行向量的方法。基本上，我想归纳%in%运算符以匹配元组而不是向量中的每个条目。例如，我想要:

row.vec = c("A", 3)
row.vec
# [1] "A" "3"

data.set = rbind(c("A",1),c("B",3),c("C",2))
data.set
#      [,1] [,2]
# [1,] "A"  "1" 
# [2,] "B"  "3" 
# [3,] "C"  "2" 

row.vec %tuple.in% data.set
# [1] FALSE

对于我的虚构运算符 %tuple.in%，因为行向量 c("A",3)不是data.set中的行向量。使用 %in%运算符可得出:

row.vec %in% data.set
# [1] TRUE TRUE

因为“A”和3在 data.set中，这不是我想要的。

我有两个问题。首先，对此是否有好的解决方案？

其次，由于我找不到它们(即使它们存在)，因此我尝试编写自己的函数来做到这一点。它适用于行向量的输入矩阵，但是我想知道是否有专家提出了改进建议:

is.tuple.in <- function(matrix1, matrix2){

     # Apply rbind() so that matrix1 has columns even if it is a row vector.
     matrix1 = rbind(matrix1)

     if(ncol(matrix1) != ncol(matrix2)){ 
      stop("Matrices must have the same number of columns.") }

     # Now check for the first row and handle other rows recursively
     row.vec = matrix1[1,]
     tuple.found = FALSE
     for(i in 1:nrow(matrix2)){
          # If we find a match, then this row exists in matrix 2 and we can break the loop
          if(all(row.vec == matrix2[i,])){
               tuple.found = TRUE
               break
          }
     }

     # If there are more rows to be checked, use a recursive call
     if(nrow(matrix1) > 1){
          return(c(tuple.found, is.tuple.in(matrix1[2:nrow(matrix1),],matrix2)))
     } else {
          return(tuple.found)
     }
}

我看到了一些我不确定如何解决的问题。首先，我希望在函数开始时弄清楚基本情况。我之所以无法做到这一点，是因为我在递归调用中传递了 matrix1[2:nrow(matrix1),]，如果 matrix1包含一行，则会产生错误。因此，我没有遇到 matrix1为空的情况，而是在最后有一个if条件来确定是否需要更多的迭代。

其次，我认为一开始对 rbind()的使用很草率，但是当 matrix1减少到一行时，我需要它。在不使用 rbind()的情况下， ncol(matrix1)在1行的情况下产生了错误。我认为我的麻烦在于缺乏对R数据类型的了解。

任何帮助，将不胜感激。

最佳答案

我想知道您是否使这一过程变得比实际复杂。例如，

set.seed(1618)
vec <- c(1,3)
mat <- matrix(rpois(1000,3), ncol = 2)
rownames(mat) <- 1:nrow(mat)


mat[sapply(1:nrow(mat), function(x) all(vec %in% mat[x, ])), ]

# gives me this
#     [,1] [,2]
# 6      3    1
# 38     3    1
# 39     3    1
# 85     1    3
# 88     1    3
# 89     1    3
# 95     3    1
# 113    1    3
# ...

如果您在意订单，可以进一步分割该子集
或者您可以稍微修改该功能:

mat[sapply(1:nrow(mat), function(x) 
  all(paste(vec, collapse = '') %in% paste(mat[x, ], collapse = ''))), ]

#      [,1] [,2]
# 85     1    3
# 88     1    3
# 89     1    3
# 113    1    3
# 133    1    3
# 139    1    3
# 187    1    3
# ...

另一个带有更长向量的例子

set.seed(1618)
vec <- c(1,4,5,2)
mat <- matrix(rpois(10000, 3), ncol = 4)
rownames(mat) <- 1:nrow(mat)

mat[sapply(1:nrow(mat), function(x) all(vec %in% mat[x, ])), ]

#      [,1] [,2] [,3] [,4]
# 57      2    5    1    4
# 147     1    5    2    4
# 279     1    2    5    4
# 303     1    5    2    4
# 437     1    5    4    2
# 443     1    4    5    2
# 580     5    4    2    1
# ...

我看到一对匹配的:

mat[sapply(1:nrow(mat), function(x) 
  all(paste(vec, collapse = '') %in% paste(mat[x, ], collapse = ''))), ]

#      [,1] [,2] [,3] [,4]
# 443     1    4    5    2
# 901     1    4    5    2
# 1047    1    4    5    2

但是只有三个

对于您的单行案例:

vec <- c(1,4,5,2)
mat <- matrix(c(1,4,5,2), ncol = 4)
rownames(mat) <- 1:nrow(mat)

mat[sapply(1:nrow(mat), function(x) 
  all(paste(vec, collapse = '') %in% paste(mat[x, ], collapse = ''))), ]

# [1] 1 4 5 2

这是上面代码的简单功能

is.tuplein <- function(vec, mat, exact = TRUE) {  
  rownames(mat) <- 1:nrow(mat)
  if (exact) 
    tmp <- mat[sapply(1:nrow(mat), function(x) 
      all(paste(vec, collapse = '') %in% paste(mat[x, ], collapse = ''))), ]
  else tmp <- mat[sapply(1:nrow(mat), function(x) all(vec %in% mat[x, ])), ]
  return(tmp)
}

is.tuplein(vec = vec, mat = mat)
# [1] 1 4 5 2

似乎有效，因此让我们创建自己的 %in%运算符:

`%tuple%` <- function(x, y) is.tuplein(vec = x, mat = y, exact = TRUE)
`%tuple1%` <- function(x, y) is.tuplein(vec = x, mat = y, exact = FALSE)

试一试

set.seed(1618)
c(1,2,3) %tuple% matrix(rpois(1002,3), ncol = 3)

#     [,1] [,2] [,3]
# 133    1    2    3
# 190    1    2    3
# 321    1    2    3

set.seed(1618)
c(1,2,3) %tuple1% matrix(rpois(1002,3), ncol = 3)

#     [,1] [,2] [,3]
# 48     2    3    1
# 64     2    3    1
# 71     1    3    2
# 73     3    1    2
# 108    3    1    2
# 112    1    3    2
# 133    1    2    3
# 166    2    1    3

关于r - 泛化R％in％运算符以匹配元组，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22414368/

27

4

0

文章推荐： error-handling - 用户生成 mzroute.js 错误

VBS教程：运算符-Or 运算符
Or 运算符对两个表达式进行逻辑“或”运算。 result = expression1 Or expression2 参数 result 任意数值变量。 expression1 任意
VBS教程：运算符-Not 运算符
Not 运算符对表达式执行逻辑非运算。 result = Not expression 参数 result 任意数值变量。 expression 任意表达式。说明下表显示如何
VBS教程：运算符-Is 运算符
Is 运算符比较两个对象引用变量。 result = object1 Is object2 参数 result 任意数值变量。 object1 任意对象名。 object2 任意
VBS教程：运算符-\ 运算符
\ 运算符两个数相除并返回以整数形式表示的结果。 result = number1\number2 参数 result 任意数值变量。 number1 任意数值表达式。 numbe
VBS教程：运算符-And 运算符
And 运算符对两个表达式进行逻辑“与”运算。 result = expression1 And expression2 参数 result 任意数值变量。 expression1
VBS教程：运算符-运算符(+)
运算符(+) 计算两个数之和。 result = expression1 + expression2 参数 result 任意数值变量。 expression1 任意表达式。 exp
Javascript + 运算符 vs - 运算符
我对此感到困惑snippet : var n1 = 5-"4"; var n2 = 5+"4"; alert(n1); alert(n2); 我知道 n1 是 1。那是因为减号运算符会将字符串“4”转
c++ - |运算符 ,++ 和 I 运算符
我想我会得到 12，而不是 7。 w++，那么w就是4，也就是100，而w++， w 将是 8，1000；所以 w++|z++ 将是 100|1000 = 1100 将是 12。我怎么了？ int
VBS教程：运算符-Xor 运算符
Xor 运算符对两个表达式进行逻辑“异或”运算。 result = expression1 Xor expression2 参数 result 任意数值变量。 expression1
VBS教程：运算符-Mod 运算符
Mod 运算符两个数值相除并返回其余数。 result = number1 Mod number2 参数 result 任意数值变量。 number1 任意数值表达式。 numbe
VBS教程：运算符-Imp 运算符
Imp 运算符对两个表达式进行逻辑蕴涵运算。 result = expression1 Imp expression2 参数 result 任意数值变量。 expression1 任
VBS教程：运算符-Eqv 运算符
Eqv 运算符执行两个表达式的逻辑等价运算。 result = expression1 Eqv expression2 参数 result 任意数值变量。 expression1 任
c++ - 时序运算符+、运算符-、运算符*和运算符/
我有一个运算符重载的简单数学 vector 类。我想为我的运算符(operator)获取一些计时结果。我可以通过计时以下代码轻松计时我的 +=、-=、*= 和/=: Vector sum; for(s
c++ - 用户定义的比较运算符(运算符>、运算符<等)
我是用户定义比较运算符的新手。我正在读一本书，其中提到了以下示例: struct P { int x, y; bool operator、运算符<等)，我们
sql - 标准 SQL bool 运算符 IS 与等于 (=) 运算符
在 SQL 的维基百科页面上，有一些关于 SQL 中 bool 逻辑的真值表。 [1] 维基百科页面似乎来源于 SQL:2003 标准。等号运算符 (=) 的真值表与 SQL:2003 草案中的 I
c++ - 奇怪的 c++ 运算符(运算符 unsigned short())
我遇到了一个奇怪的 C++ 运算符。 http://www.terralib.org/html/v410/classoracle_1_1occi_1_1_number.html#a0f2780081f
C++:如果我重载 new 运算符，我是否也必须重载 delete 运算符？
我正在阅读关于 SO 和 answers 中的一个问题，它被提到为: If no unambiguous matching deallocation function can be found, pr
python - 如何在不使用 * 运算符(或/运算符)的情况下递归地将两个正整数相乘？ .您可以使用加法、减法和位移
我偶然发现了这个解决方案，但我无法理解其中到底发生了什么。谁能解释一下! 据我了解，它试图通过计算一半的单元格然后将其加倍来计算 a*b 网格中的单元格数量。但是我无法理解递归调用。请不要建议其他解
Go学习笔记（6）Go基本类型&运算符
Go的基本类型布尔类型bool 长度：1字节取值：布尔类型的取值只能是true或者false，不能用数字来表示整型通用整型 int / uint（有符号 / 无符号，下面也类似）长度：根据运
JavaScript 运算符
在本教程中，您将学习JavaScript中可用的不同运算符，以及在示例的帮助下如何使用它们。什么是运算符？在JavaScript中，运算符是一种特殊符号，用于对运算数（值和变量）执行操作。例如，

首页

博学

6Ren·AI

商城

r - 泛化R％in％运算符以匹配元组