gpt4 book ai didi

ruby - 如何检查在Regexp(ruby)中声明了多少个变量(掩码)?

转载 作者:太空宇宙 更新时间:2023-11-03 16:04:24 25 4
gpt4 key购买 nike

假设我有一个regexp,其中包含任意数量的捕获组:

pattern = /(some)| ..a lot of masks combined.... |(other)/

有什么方法可以确定其中的一些组吗?

最佳答案

如果您总能找到与给定正则表达式匹配的字符串,那么将其与正则表达式匹配就足够了,并且look at the match data length。然而,确定regexp是否有它匹配的字符串是np-hard[1]这是唯一可行的,如果你事先知道什么样的正则表达式你会得到。
Regexp类中的次佳方法是Regexp#sourceRegexp#to_s但是,如果这样做,我们需要解析regex。
我不能为将来说话,但是从ruby 2.0开始,在Regexp核心类中没有更好的方法。
左括号表示文字左括号(如果前面有无转义反斜杠)。反斜杠是非转义的,除非非转义的反斜杠在前面。因此,一个字符的转义iff前面有奇数个反斜杠。
无转义左括号表示捕捉组iff,后面不跟问号。有了问号,它可以表示不同的含义:(?'name')(?<name>)表示一个命名的捕获组。然而,命名的和未命名的捕获组不能共存于相同的正则表达式中(2)。(?:)表示非捕获组。这是(?flags-flags:)的特例(?>)表示原子群。(?=)(?!)(?<=)(?<!)表示环视。(?#)表示注释。
ruby regexp引擎支持regex中的注释。在主regex中考虑它们是非常困难的。如果我们真的想支持它们,我们可以尝试剥离它们,但是完全支持它们会变得很混乱,因为内联标志可能会以正则表达式无法捕获的方式打开或关闭扩展模式(从而打开或关闭行注释)我将继续,不支持regex注释[3]中的无转义括号。
我们想数数:
左括号的数目\(
没有用反斜杠转义的(读:前面没有奇数个没有另一个反斜杠的反斜杠)
后面没有问号(?<!(?<!\\)(?:\\\\)*\\)
ruby不支持无限的lookbehind,但是如果我们首先反转源代码,我们可以稍微重写第一个断言:(?!\?)。第二个断言变成了lookbehind:(?!(?:\\\\)*(?!\\))
整个解决方案

def count_groups(regexp)
# named capture support:
# named_count = regexp.named_captures.count
# return named_count if named_count > 0

# main:
test = /(?!<\?)\((?!(?:\\\\)*(?!\\))/
regexp.source.scan(test).count
end

[1]:我们可以通过将可满足性问题转化为NP硬度来表示:
和: (?<!\?)xy必须是断言)
或: x
不: x|y
原子: (?!x)(?=1)(?=.1),…, (?=..1)(?!1)
示例(异或): (?!.1)
这扩展到任何一类正则表达式的np完全性,这些正则表达式可以在多项式时间内进行测试。这包括任何没有嵌套重复(或重复的对重复或递归的反向引用)并且具有可选匹配的有界嵌套深度的正则表达式。
[2]: /^(?:(?=1)(?!.1)|(?!1)(?=.1))..$/返回 /((?<name>..)..)../.match('abcdef').to_a,表示存在命名捕获组时忽略未命名捕获组。在Ruby1.9.3中测试
[3]:内联注释以 ['abcdef', 'ab']开头,以 (?#结尾。它们不能包含无转义的右括号,但可以包含无转义的左括号。这些可以很容易地剥离(尽管我们不得不在所有地方撒上“未经修饰”的regex),是较小的邪恶,但它们也不太可能包含无修饰的左括号。
行注释以 )开头,以换行符结尾这些仅在扩展模式下作为注释处理在扩展模式之外,它们匹配文本 #和换行符这仍然很容易,即使我们不得不考虑再次逃跑确定regex是否具有扩展标志集并不太困难,但标志修改器组完全不同。
即使使用ruby的awesome recursive regexes,仅仅确定一个先前打开的修改扩展模式的组是否已经关闭,也会产生一个非常糟糕的regex(即使您一个接一个地替换,并且不必跳过注释,也必须考虑转义)。它不会很漂亮(即使有插值),也不会很快。

关于ruby - 如何检查在Regexp(ruby)中声明了多少个变量(掩码)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17497179/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com