r - 比较两个 data.frame 并删除具有共同字符的行-6ren

r - 比较两个 data.frame 并删除具有共同字符的行

转载作者：行者123 更新时间：2023-12-01 08:05:57

25

4

我有两个 data.frame x1 和 x2。如果在 x1 和 x2 中发现了共同基因，我想从 x2 中删除行

x1 <- chr   start   end         Genes   
      1      8401    8410      Mndal,Mnda,Ifi203,Ifi202b    
      2      8001    8020      Cyb5r1,Adipor1,Klhl12    
      3      4001    4020      Alyref2,Itln1,Cd244  

x2 <- chr   start   end         Genes
      1      8861   8868       Olfr1193 
      1      8405    8420      Mrgprx3-ps,Mrgpra1,Mrgpra2a,Mndal,Mrgpra2b   
      2      8501    8520      Chia,Chi3l3,Chi3l4   
      3      4321    4670      Tdpoz4,Tdpoz3,Tdpoz5 



x2 <- chr   start   end         Genes   
      1      8861   8868       Olfr1193
      2      8501    8520      Chia,Chi3l3,Chi3l4   
      3      4321    4670      Tdpoz4,Tdpoz3,Tdpoz5

最佳答案

你可以试试

x2[mapply(function(x,y) !any(x %in% y), 
        strsplit(x1$Genes, ','), strsplit(x2$Genes, ',')),]
#  chr start  end                Genes
#2   2  8501 8520   Chia,Chi3l3,Chi3l4
#3   3  4321 4670 Tdpoz4,Tdpoz3,Tdpoz5

或者将 !any(x %in% y) 替换为 length(intersect(x,y))==0。

注意:如果“Genes”列是“factor”，请将其转换为“character”，因为 strsplit 不能采用“factor”类。即 strsplit(as.character(x1$Genes, ','))

更新

基于 'x2' 的新数据集，我们可以通过 'chr' 列合并两个数据集，strsplit 'Genes.x', 'Genes .y' 来自输出数据集('xNew')，根据 'Genes.x' 的任何元素在 'Genes.y' 字符串中的出现获取逻辑索引，使用它来子集 'x2' 数据集

 xNew <- merge(x1, x2[,c(1,4)], by='chr')
 indx <- mapply(function(x,y) any(x %in% y), 
      strsplit(xNew$Genes.x, ','), strsplit(xNew$Genes.y, ','))
 x2[!indx,]
 # chr start  end                Genes
 #1   1  8861 8868             Olfr1193
 #3   2  8501 8520   Chia,Chi3l3,Chi3l4
 #4   3  4321 4670 Tdpoz4,Tdpoz3,Tdpoz5

关于r - 比较两个 data.frame 并删除具有共同字符的行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29082934/

25

4

0

文章推荐： python - Kadane 算法中的 global_max 值

文章推荐： python - 通过预先应用的参数 move 多个文件

文章推荐： r - 获取 axis.text 和 axis.title 之间的边距值

共同 friend 类的 C# 解决方法
所以，我有一个类似于 this one 的用例，但我觉得有一些额外的细节值得提出一个新问题。 ( related questions ，供引用) 我正在编写一个实现 a cycle 的数据结构.基本设
sql - Django:根据相交对象(共同 friend )的数量排序项目
我正在使用 Django 编写一个社交网络应用程序，需要实现类似于 Facebook“Mutual Friends”概念的功能。我有一个像这样的简单模型: class Friend(models.Mo
ios - 我怎样才能在我的应用程序上获得两个 facebook 用户之间的*所有*共同 friend ？
我有一个 iOS 应用程序，用户可以在其中使用 Facebook 登录并授予 user_friends 权限。从 Graph API 2.0 开始，Facebook 声称你无法获取两个人之间所有的共同
friend 、共同 friend 、 friend friend 等的 SQL 表
我想知道将来对我来说最简单的方法是什么，可以使查询既有效又不那么复杂。我应该像这样保存双向关系吗 from_id=1, to_id=2from_id=2, to_id=1 或者只创建一个唯一的行 f

首页

博学

6Ren·AI

商城

r - 比较两个 data.frame 并删除具有共同字符的行

更新