r - str_extract 仅捕获重复关键字的一个实例-6ren

r - str_extract 仅捕获重复关键字的一个实例

转载作者：行者123 更新时间：2023-12-04 09:13:10

37

4

当我在具有某个关键字的重复实例的字符串上使用 str_extract() 时，它只捕获其中一个。

> str_extract("1234cAc5678cAc90123", ".....A.....")
[1] "1234cAc5678"

我有两个问题:

选择一个而不是另一个的标准是什么？ (即“5678cAc9012”)

无论字符串是否重叠，如何使 R 每次发生时提取实例？

当字符串不重叠时，str_extract_all 给出了 2 个实例，这意味着 str_extract 只捕获重复出现的字符串的第一个实例。

> str_extract_all("1234cAc5678cAc90123", "...A...")
[[1]]
[1] "34cAc56" "78cAc90"

是否有任何其他函数可以显示所有事件，即使它们重叠，如下所示:

[1] "1234cAc5678"
[2] "5678cAc9012"

甚至这个:

> str_extract("0123A456A7890", "....A....")
[1] "0123A456A"
[2] "A456A7890"

最佳答案

如果我们正在寻找重叠匹配，那么使用 stri_match_all

library(stringi)
stri_match_all_regex(str1, "(?=(.{5}A.{5}))")[[1]][,2]
#[1] "1234cAc5678" "5678cAc9012"

或者，如果我们使用 stringr ，它调用 stringi ，然后使用 str_match_all

str_match_all(str1, "(?=(.{5}A.{5}))")[[1]][,2]
#[1] "1234cAc5678" "5678cAc9012"

str_match_all("0123A456A7890", "(?=(.{4}A.{4}))")[[1]][,2]
#[1] "0123A456A" "A456A7890"

数据

str1 <- "1234cAc5678cAc90123"

关于r - str_extract 仅捕获重复关键字的一个实例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46557289/

37

4

0

文章推荐： R:将其编写为函数的变量排名模型自动化代码

文章推荐： command-line - 命令行差异实用程序

R str_extract 省略号前后的所有内容
我正在尝试找到一种方法，将中间带有省略号的字符列拆分为两列，省略号之前的所有内容和之后的所有内容。例如，如果我有: a [1] "60.4 (b)(33) and (e)(1) revised"
r - str_extract 仅捕获重复关键字的一个实例
当我在具有某个关键字的重复实例的字符串上使用 str_extract() 时，它只捕获其中一个。 > str_extract("1234cAc5678cAc90123", ".....A.....
regex - str_extract 特定模式(示例)
我仍然对正则表达式语法有些困惑。你能帮我解决这些模式吗: _A00_A1234B_ _A00_A12345B_ _A1_A12345_ 到目前为止我的方法: vapply(strsplit(files
r - stringr str_extract 捕获组捕获所有内容
我正在寻找从字符串中提取年份。这总是在“X”之后和“。”之前。然后是一串其他字符。使用 stringr的 str_extract我正在尝试以下操作: year = str_extract(strin
r - 如何从 str_extract 中提取精确的字符串？
我有一个名为 eventtext 的文本向量，我想从此向量中提取其中包含 "PR" 的值。然而，当我在真实数据上使用它时，我意识到我还选取了诸如 "PRESENT" 之类的值，因为该单词中包含 "PR
r - 如何用基础 R 做 str_extract ？
我正在平衡多个版本的 R，并希望根据我使用的 R 和操作系统来更改加载的 R 库。因此，我想坚持使用基本的 R 函数。我正在阅读此页面以了解基本 R 相当于 stringr::str_extract
regex - 字符串，str_extract : how to do positive lookbehind?
很简单的问题。我只需要使用正则表达式正向查找捕获一些字符串，但我没有找到一种方法来做到这一点。这是一个例子，假设我有一些字符串: library(stringr) myStrings result
regex - 如何在 R 中 str_extract 百分比？
从这个字符串 border-color:#002449;left:74.4%top;37%; 我想让第一个百分比 74.4% 成为一个名为 X 和第二个百分比 37% 一个名为 Y 的变量。我试过使
r - 在 R 中使用 str_extract 在带有正则表达式的子字符串之前提取数字
我想在stringr包中使用str_extract从XX nights etcetc形式的字符串中提取数字. 我目前正在这样做: library(stringr) str_extract("17 ni
r - str_extract : Extracting exactly nth word from a string
我知道这个问题已经在好几个地方问过了，但我没有看到这个问题的准确答案。所以我试图在正则表达式的帮助下从 R 中的字符串(“trying to”)中准确提取第二个单词。我不想使用 unlist(str
r - 将 stringr str_detect 管道传输到 str_extract 时出现问题 - extract 仅从第一行提取文本 : argument is not an atomic vector; coercing
我正在尝试创建一个新列，其中仅包含表达式中的某些数字数据。这是我的数据:https://pastebin.com/hYg3zqYz 我只需要第 12 列中“双极”之后的数字。这是有效的 p %
r - 将 stringr str_detect 管道传输到 str_extract 时出现问题 - extract 仅从第一行提取文本 : argument is not an atomic vector; coercing
我正在尝试创建一个新列，其中仅包含表达式中的某些数字数据。这是我的数据:https://pastebin.com/hYg3zqYz 我只需要第 12 列中“双极”之后的数字。这是有效的 p %

首页

博学

6Ren·AI

商城

r - str_extract 仅捕获重复关键字的一个实例