正则表达式帮助，基于字符串末尾第 n 次出现的子集-6ren

正则表达式帮助，基于字符串末尾第 n 次出现的子集

转载作者：行者123 更新时间：2023-12-02 16:03:45

24

4

一个示例向量:

string <- "Junk1_Junk2_Junk3__ID1_Junk4_Junk5.pdf"

我试图通过从右边数 _(下划线)来对 ID1 进行子集化；所以从右边数第二个和第三个下划线之间的子集。

预期输出:ID1

我的尝试是尝试使用双__，但这行不通，因为并非我的所有字符串列表都有它。

尝试:(_){2}([^_]+)

旁注，我正在努力适应正则表达式；请推荐一个资源来构建和测试。

感谢任何帮助。

最佳答案

你可以使用

library(stringr)
stringr::str_extract(string, "[^_]+(?=(?:_[^_]*){2}$)")

或者，与基础 R 相同的方法:

## Base R:
sub(".*?([^_]+)(?:_[^_]*){2}$", "\\1", string)

参见 regex demo和 R demo online .

详细信息:

[^_]+ - 除_ 以外的一个或多个字符
(?=(?:_[^_]*){2}$) - 需要两个 _ 序列的正前瞻然后是除 _ 之外的任何字符的零次或多次重复直到字符串结束
.*?([^_]+)(?:_[^_]*){2}$火柴
- .*? - 任何零个或多个字符，尽可能少
- ([^_]+) - 捕获组 1(替换模式中的 \1 指的是这个捕获的字符串):除 _ 之外的一个或多个字符
- (?:_[^_]*){2} - _ 的两个序列然后是除 _ 之外的任何字符的零次或多次重复
- $ - 字符串结束。

关于正则表达式帮助，基于字符串末尾第 n 次出现的子集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69981998/

24

4

0

文章推荐： javascript - 过滤数组并比较但跳过空值

文章推荐： python - 将列标题转换为 Python 中的值和相应计数

文章推荐： javascript - 使用时刻的小时数之间的差异

文章推荐： regex - Julia - 使用正则表达式从字符串中提取数字

jquery - 将字符串添加到 URL 末尾
我正在更改链接网址以添加 www.site.com/index.html?s=234&dc=65828 我通过此代码得到的是:site.com/&dc=65828 var target="&dc=65
尽管有返回值，但控制仍到达非 void 末尾
我在编译过程中收到错误: src/smtp.c:208:1: warning: control reaches end of non-void function [-Wreturn-type] 这是相
javascript - 如何将输入字段扩展到 div 末尾
这是我的 bootstrap/html 代码: Put email 位置正确，但我希望输入字段的大小延伸到 div 末尾。谁能帮帮我？最佳答案只需按百分比指定宽度，如下所示
javascript - 如何将字符串化对象添加到 url 末尾
我正在尝试获取一个像这样的 json 对象: filters = {"filters": myArray}; 并将其附加到 URL 的末尾，使用: this.router.navigate([`/de
javascript - 哈希符号添加到 URL 末尾？
这个问题已经有答案了: Remove hash from url (5 个回答) 已关闭 10 年前。我有一个网站，stepaheadresidents.com ，并且井号 (#) 会自动添加到 u
javascript - 将链接移动到 div 末尾
我有这个代码 $('container a').appendTo('.container'); dzedzdqdqdqzdqdzqdzqdqzdqd Forgot password
python - 将字符串添加到 URL 末尾
为了练习更多 Python 知识，我尝试了 pythonchallenge.com 上的挑战简而言之，作为第一步，此挑战要求从末尾带有数字的 url 加载 html 页面。该页面包含一行文本，其中有
scala - FS2 流运行直到 InputStream 末尾
我对 FS2 很陌生，需要一些有关设计的帮助。我正在尝试设计一个流，它将从底层的 InputStream 中提取 block ，直到结束。这是我尝试过的: import java.io.{File,
scala - FS2 流运行直到 InputStream 末尾
我对 FS2 很陌生，需要一些有关设计的帮助。我正在尝试设计一个流，它将从底层的 InputStream 中提取 block ，直到结束。这是我尝试过的: import java.io.{File,
javascript - json_encode 将空数组放在 json 末尾
我正在编写一个 ajax 应用程序，并且在 php 脚本中有一个函数: public function expire_user() { $r=array("return"=>'OK');
c++ - 如何确定何时位于 QListView 的底部/末尾？
我正在使用一个QListView，它包装了一个非常简单的列表模型。我想尝试实现类似于某些网页中看到的“无限滚动”的东西。目前，模型通过最多添加 100 个项目的方法更新(它们取自外部 Web API
ruby - 到达文件的 cucumber 末尾(EOFError)
运行 cucumber 测试给我以下错误 end of file reached (EOFError) /usr/lib64/ruby/2.0.0/net/protocol.rb:153:in
rest - URL 末尾 ID 的优缺点
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
javascript - ?ver= include 末尾 - 是否有技术效果？
我想知道版本命名的具体作用是什么？喜欢 jquery.js?ver=1.4.4 我的意思是如果我使用像这样的 cdn jquery/1.4.4/jquery.min.js?ver=1.4.4但是另一
php - 在扩展前的 url 末尾 append 字符串
" data-fancybox-group="gallery" title="">" alt="" /> 在此代码中 echo $prod['item_image_url'];打印存储在我的表中的图像
wordpress - 将 .html 添加到 URL 末尾
我目前使用 Wordpress 作为博客平台，但我想更改为使用 Jekyll 来生成静态页面。在 WordPress 上，我的 URL 使用以下格式: /年/月/日/标题但我想将其重定向到 /年/月
elasticsearch - anchor token 替换模式到 token 末尾
根据docs这应该是不可能的 Regular expressions cannot be anchored to the beginning or end of a token 尽管如此，它似乎对我有
javascript - 将动态生成的 dijit 附加到 div 末尾
有没有办法创建 dijit 并将其附加到 div 的末尾？假设我有以下代码: Add Person 我在网上找到了以下代码，但这替换了我的“attendants”div: var personCo
php - 将 JSON 对象附加到 URL 末尾
我有这段代码: //execute post (the result will be something like {"result":1,"error":"","id":"4da775
c - 插入到简单链接列表(任何位置、前端、末尾、中间)
我需要一些函数方面的帮助。我想编写一个插入链表的函数。但不仅仅是中间，如果必须插入前端或末尾，它也必须起作用。结构: typedef struct ranklist { i

首页

博学

6Ren·AI

商城

正则表达式帮助，基于字符串末尾第 n 次出现的子集