gpt4 book ai didi

ruby - 如何从 Ruby 正则表达式中提取可变数量的子匹配项?

转载 作者:太空宇宙 更新时间:2023-11-03 17:41:03 25 4
gpt4 key购买 nike

我有一些字符串,我想对其进行模式匹配,然后将匹配项提取为变量 $1、$2 等。

我的模式匹配代码是

a = /^([\+|\-]?[1-9]?)([C|P])(?:([\+|\-][1-9]?)([C|P]))*$/i.match(field)

result = #{a.to_a.inspect}

通过上面的内容,我可以轻松匹配以下示例字符串:

"C", "+2C", "2c-P", "2C-3P", "P+C"

我已经在 Rubular 网站上确认了所有这些工作。
但是,当我尝试匹配“+2P-c-3p”时,它会匹配,但是 MatchData“类数组对象”看起来像这样:

result = ["+2P-C-3P", "+2", "P", "-3", "P"]

问题是我无法将中间模式“-C”提取到数组中。

我希望看到的是:

result = ["+2P-C-3P", "+2", "P", "-", "C", "-3", "P"]

好像只提取结尾部分“-3P”为“-3”和“P”

有谁知道如何修改我的模式以捕获中间匹配项?
所以作为另一个例子,+3c+2p-c-4p,我希望应该创建:

["+3c+2p-c-4p", "+3", "C", "+2", "P", "-", "C", "-4", "P"]

但我得到的是

["+3c+2p-c-4p", "+3", "C", "-4", "P"]

完全错过了中间部分。

最佳答案

您对字符类的工作方式存在深刻(但普遍)的误解。这:

[C|P]

错了。除非你想匹配管道 | 字符。字符类别没有交替 - 它们不像组。这是正确的:

[CP]

此外,字符类中没有元字符,因此您只需转义很少的字符(即右方括号 ] 和破折号 -,除非你把它放在组的末尾)。所以你的正则表达式减少到:

^([+-]?\d?)([CP])(?:([+-]?\d?)([CP]))*$

您的第二个误解是组计数是动态的——您以某种方式在结果中有更多的组,因为字符串中出现了更多的匹配项。事实并非如此。

结果中的组数与正则表达式中括号对的数量完全一样(当然要少非捕获组的数量)。在本例中,该数字为 4。不多也不少。

如果一个组匹配多次,则只保留最后一次匹配出现的内容。无法(在 Ruby 中)获取该组先前匹配项的内容。

作为替代方案,您可以使用正则表达式将字符串拆分为有意义的部分,然后在循环中解析它们以提取所有信息。

关于ruby - 如何从 Ruby 正则表达式中提取可变数量的子匹配项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3848995/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com