r - 仅在顶层拆分带有嵌套括号的字符串，其中 "level"由括号确定-6ren

r - 仅在顶层拆分带有嵌套括号的字符串，其中 "level"由括号确定

转载作者：行者123 更新时间：2023-12-02 16:22:31

25

4

我正在尝试创建一个正则表达式，它允许我仅在中央逗号处拆分下面的字符串。

str_1 <- "N(0, 1)"
str_2 <- "N(N(0.1, 1), 1)"
str_3 <- "N(U(0, 1), 1)"
str_4 <- "N(0, T(0, 1))"
str_5 <- "N(N(0, 1), N(0, 1))"

将它们视为分布的参数。现在，我想拆分“顶级”的逗号。

一些细节:数字可以是十进制数，可以是正数也可以是负数。它们将始终在 U()、N()、LN() 或 T() 中分组并以逗号分隔。稍后将添加更多分组，因此需要更通用的解决方案或易于扩展。我要做的是在“顶级”逗号处拆分表达式。

现在，str_1 的第一个案例直接使用:

unlist(strsplit(str_1, ",", perl = TRUE))

在我继续之前，我需要知道我是否有嵌套。我知道如果有嵌套，我将拥有不止一个 N、U、LN 或 T。所以为了检查，我做了(对于 str_2):

length(attr(gregexpr("(N|LN|U|T)", str_2, perl = TRUE)[[1]], "match.length")) > 1

确定我是否有嵌套(这可能是一种更简洁的测试方法？)后，我可以继续计算剩余字符串的拆分。但是，这就是我被困的地方。鉴于我无法计算逗号，因为情况 str_2、str_3 和 str_4 会产生歧义。我如何确保只在中央逗号处拆分？

我希望得到以下输出(因此去掉第一个字母和括号以及最后一个括号)

# str_2
"N(0.1, 1)" "1"

# str_3
"U(0, 1)" "1"

# str_4
"0" "T(0, 1)"

# str_5
"N(0, 1)" "N(0, 1)"

如果可能的话，我想继续使用 base R 来减少代码的依赖数量。任何帮助深表感谢。这也可能无法通过正则表达式解决，但需要一种可能通过递归的编程方法，如 this 中的建议Java问题。

最佳答案

如果您的字符向量采用您显示的格式，您可以使用单个 PCRE 正则表达式实现所需的内容:

(?:\G(?!^)\s*,\s*|^N\()\K(?:\d+|\w+(\([^()]*(?:(?1)[^()]*)*\)))(?=\s*,|\)$)

参见 regex demo . 详情

(?:\G(?!^)\s*,\s*|^N\() - 上一次成功匹配的结尾 (\G(?!^ )) 然后是用零个或多个空白字符括起来的逗号 (\s*,\s*) 或 N( 开头的字符串字符串 (^N\()
\K - 一个匹配重置运算符，它丢弃目前匹配内存缓冲区中所有匹配的文本
(?: - 非捕获组的开始
- \d+ - 一个或多个数字
- | - 或者
- \w+ - 一个或多个单词字符
- ($[^()]*(?:(?1)[^()]*)*$) - 第 1 组(需要递归才能正常工作):a (，然后是 ( 和 ) 以外的任何零个或多个字符，然后是第 1 组模式的零个或多个出现(递归)和然后是 ( 和 ) 以外的零个或多个字符，然后是 ) 字符
) - 非捕获组结束
(?=\s*,|\)$) - 字符串末尾紧跟零个或多个空格，然后是逗号或 ) 字符。

参见 regex demo :

strs <- c("N(0, 1)", "N(N(0.1, 1), 1)", "N(U(0, 1), 1)", "N(0, T(0, 1))", "N(N(0, 1), N(0, 1))")
p <- "(?:\\G(?!^)\\s*,\\s*|^N\\()\\K(?:\\d+|\\w+(\\([^()]*(?:(?1)[^()]*)*\\)))(?=\\s*,|\\)$)"
regmatches(strs, gregexpr(p, strs, perl=TRUE))
# => [[1]]
#    [1] "0" "1"
#    
#    [[2]]
#    [1] "N(0.1, 1)" "1"        
#    
#    [[3]]
#    [1] "U(0, 1)" "1"      
#    
#    [[4]]
#    [1] "0"       "T(0, 1)"
#    
#    [[5]]
#    [1] "N(0, 1)" "N(0, 1)"

关于r - 仅在顶层拆分带有嵌套括号的字符串，其中 "level"由括号确定，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65235254/

25

4

0

文章推荐： image - 在 pytorch 中加载 csv 和图像数据集

文章推荐： python - 如何根据python中的不同条件动态创建列表？

文章推荐： flutter - 如何在 Flutter 中创建带有对象的下拉列表

文章推荐： awk - 删除数据直到字段中的某个字符

Python Tkinter 顶层
我正在开发一个需要多个窗口的程序，第一个出现的是登录窗口，我使用了 Toplevel 小部件以使其他窗口成为其子窗口，但这段代码一直显示两个窗口而不是一个。 from Tkinter import F
syntax - 带有语法扩展的 OCaml 顶层
我不知道一般如何实现这一点，但为了清楚起见，我会特别询问一个实例: Sexplib 对我来说看起来很有趣。我想玩弄它。我已经下载了它，安装得很好(反正我很确定)等等。我想在顶层使用“with sexp
makefile - 顶层 makefile 中的输出
我在 makefile 中设置一个变量，如下所示: SOMEVAR = foo 此 makefile 稍后包含一些其他 makefile，在其中进行实际的程序构建: include generic/M
python - Tkinter GUI 顶层
from tkinter import* import tkinter as tk def topLevel(): top=Toplevel() top.title("Listbox
comments - 如何检查 OCaml 顶层 (*) 的类型？
我想查看乘法函数 (*) 的类型，因此我将其输入 OCaml 顶层。 # (*) 然而，顶层回应: (*);; 1: this is the start of a comment. 然后消耗我输入的任
ocaml - 摆脱 ;;在 OCaml 顶层
我喜欢Try Ocaml的顶层行为:;; 在我按下 Enter 时隐式添加，并且我能够使用 Shift-Enter 进行多行编辑。是否有可能在标准顶层或 utop 中获得相同的功能？最佳答案目前
debugging - 我们可以查看部分推断的输入信息吗？来自 Ocaml 顶层/编译器的程序无法编译？
我想知道，在 Ocaml 中，是否有部分输入信息。对于无法编译的程序，可以通过顶层/编译器的某些现有功能来绘制吗？让我解释。在 Ocaml 中，众所周知，可以通过 -annot 文件检索推断类型。但
svg - 在 SVG 中创建 Illustrator 顶层
当我将分层 SVG 文件加载到 Illustrator 中时，所有图层都按其应有的方式工作，但它们始终位于新图层下；我没有指定“第 1 层”。如何创建一个 SVG，使我的顶层最终也成为 Illust
python - Tkinter 顶层 : Opening treeview to fit the frame
我遇到了让我的 TreeView 填充已创建的顶层窗口的挑战，已尝试 fill=“x”和 fill=“both”，但没有得到结果。有任何建议这样做。 from tkinter import ttk i
javascript - .find() 顶层
标签在 div 中
我有以下布局: target target not target 我的问题是，如何定位所有顶级标签(参见 target )使用 .fin
iphone - 触摸设备(ipad、iphone)和 100% 宽度和高度的 CSS 顶层？
大家好，我有一个 div.mapFullscreenContainer #mapFullscreenContainer { position:fixed; top:0; lef
objective-c - 标签栏作为 View Controller 顶层 View 的 subview ；画得不正确
我有一个以编程方式创建的标签栏 Controller ，名为 TPastJourneyTabbar。当我单击 TableView 并调用 didSelectRowAtIndexPath: 时，我的选项

首页

博学

6Ren·AI

商城

r - 仅在顶层拆分带有嵌套括号的字符串，其中 "level"由括号确定