r - 在 R 中通过 grepl 合并两个数据帧-6ren

r - 在 R 中通过 grepl 合并两个数据帧

转载作者：行者123 更新时间：2023-12-04 11:16:37

24

4

假设我有两个数据框:

df1<-data.frame(x=c("abc", "def", "ghi", NA), y=1:4)
df1
    x y
1 abc 1
2 def 2
3 ghi 3
4 NA  4
df2<-data.frame(x=c("a", "i"), z=4:5)
df2
  x z
1 a 4
2 i 5

我想要的是通过 grepl df2 的 x 在 df2 的 x 中合并 df1 和 df2，这样一个期望的结果是:

df3
    x y  z
1 abc 1  4
2 def 2 NA
3 ghi 3  5
4 NA  4  NA

实际的数据框要大得多，似乎需要几行代码。我想知道是否有一种简单的方法。

最佳答案

这是一个在 df1.x 中搜索 df2.x 的单行代码:

library(sqldf)

sqldf("select df1.*, df2.z from df1 left join df2 on instr(df1.x,  df2.x)")

给予:

     x y  z
1  abc 1  4
2  def 2 NA
3  ghi 3  5
4 <NA> 4 NA

关于r - 在 R 中通过 grepl 合并两个数据帧，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41899141/

24

4

0

文章推荐： r - dplyr 在列子集上突变(所有这些列上的一个函数组合)

文章推荐： python - google colaboratory 中的实时协作

文章推荐： mda - 是否有真实世界应用程序的 MDSD/MDA 成功案例？

r - 为什么 grepl 不在 grepl (".*", LETTERS, fixed=T) 中返回 true？
我希望这段代码返回一个包含 26 个 TRUE 的向量，但它返回的都是 FALSE。 grepl(".*", LETTERS, fixed=T) 从文档中，“grepl 返回一个逻辑向量(匹配或不匹配
r - 跨多个指定列的 grepl
我想在我的数据框中创建一个新列，该列是 TRUE 还是 FALSE，具体取决于术语是否出现在两个指定的列中。这是一些示例数据: AB M AB
r - 通过将列保存在列表中来跨列应用 grepl？
我有一个格式如下所示的数据框: String Keyword 1 Apples bananas mangoes
r - grepl 在两个向量上逐个元素
我想在两个向量上应用 grepl 以查看第一个向量的元素是否在第二个向量的相应元素中可用。例如 grepl(c("bc","23","a2"),c("abcd","1234","zzzz")) 由于
r - 基于字符串列表的子集使用 grepl()？
我正在做一些看似非常简单的事情。我想使用 grepl() 命令——或类似的命令——在几个不同的短语上对 R 中的数据帧进行子集化，而不构建循环。例如，我想提取名为 Bob 或 Mary 的任何人的所
r - grepl 与正则表达式
我在将 grepl 与正则表达式结合使用时遇到困难。这是一个小例子: 我有一个字符向量: text D_.+ | \\>F_.+", text) grepl("\\D_.+ | \\F_.+", t
r - grepl:在不包含模式的字符串中搜索
看来，虽然grep具有反转参数，但 grepl 没有。我想为使用2个过滤器的子集 data$ID[grepl("xyx", data$ID) & data$age>60] 如何为年龄大于60且ID为
r - 在条件下加入两个数据帧(grepl)
我希望根据条件连接两个数据帧，在本例中，一个字符串在另一个字符串中。假设我有两个数据框， df1 % # Format resulting dataset as you requested.
r - 在条件下加入两个数据帧(grepl)
我希望根据条件连接两个数据帧，在本例中，一个字符串在另一个字符串中。假设我有两个数据框， df1 % # Format resulting dataset as you requested.
R grepl - 将模式与字符串匹配
我在 R 中使用 grepl() 将模式与字符串进行匹配。我需要将多个字符串与一个公共(public)字符串匹配，如果它们全部匹配，则返回 TRUE。例如: a <- 'DEARBORN TRUC
r - 使用另一个数据框和 grepl 在数据框中搜索字符串
我需要使用另一个数据框按列过滤数据框，但由于匹配不准确，我想使用 grepl 是一种方法。下面的代码可以作为例子: A % filter(.,grepl("RT",X)) # the result
r - 使用 grepl 从多列文本中提取值
我有一个数据框 (df)，其中包含州和城市的 2 列数据。但是，有时 2 列中的数据会被调换或输入错误。数据框看起来像这样: location state Bangkok
从多个字符串的 grepl 匹配中返回匹配的字符串，而不是逻辑
目前我正在使用带有 grepl 的嵌套 ifelse 函数来检查与数据框中的字符串向量是否匹配，例如: # vector of possible words to match x my_text$n
regex - 使用 grepl 从模式列表中查找匹配模式
我使用 grepl 检查字符串是否包含一组模式中的任何模式(我使用“|”来分隔模式)。反向搜索没有帮助。如何识别匹配的模式集？附加信息:这可以通过编写一个循环来解决，但它非常耗时，因为我的集合有 >
r - 使用 grepl 匹配具有一个特定数字的名称
我有一个包含列名和行名的数据，其中包含一个从 1 到 100 的数字的字符串。我正在使用 grepl 来选择具有特定数字的名称(同时忽略字符串)。说我有: a <- matrix(c(1:16),
r - 和 grepl 一起吃
我有一个数据(大数据 125000 行，~20 MB)，其中一些具有特定字符串的行需要删除，并且在读取过程中需要选择一些列。首先，我发现grepl功能无法正常工作，因为 fread将数据作为此 qu
R 的 grepl() 查找多个字符串存在
这个问题在这里已经有了答案: R regex to find two words same string, order and distance may vary (2 个回答) 去年关闭。 grep
r - 如何使 grepl 功能具体化？
我的数据框如下所示。我需要根据“geneID”列的名称一一提取特定行的数据。我使用 grepl 函数。 #Data frame:geneDf geneID=c("EGFR","Her2","PTEN
r - 在特定列中与 grepl 匹配的模式后过滤行
我有一个数据集(名为桌面)，其中包含来自网络跟踪器的按时间顺序排列的信息，其中包含一列中不同用户访问的 URL 和另一列中的用户 ID。以搜索引擎分析为目标，我试图过滤所有包含用户向谷歌提交搜索查询的
r - 使用 grepl 创建基于另一列的列
让我们考虑一个包含两列word 和stem 的df。我想创建一个新列来检查 stem 中的值是否包含在 word 中，以及它前面或后面是否有更多字符。最终结果应该是这样的: WORD STEM

首页

博学

6Ren·AI

商城

r - 在 R 中通过 grepl 合并两个数据帧