regex - 为什么贪婪的量词比懒惰的量词便宜-6ren

regex - 为什么贪婪的量词比懒惰的量词便宜

转载作者：行者123 更新时间：2023-12-04 13:48:09

28

4

http://www.rexegg.com/regex-quantifiers.html#tempered_greed

贪婪的量词(默认值)-吞下允许的尽可能多的字符，然后再慢慢减少逐一匹配的字符数，以便为其余的模式腾出空间。

例如，针对字符串.*world的正则表达式hello world将首先尝试吞下整个字符串并将其放入.*中。但是它不能，因为那时world无法匹配，所以.*开始一个接一个地放弃字符，直到它放弃了原始字符串中的world为止(在这种情况下，整个正则表达式都可以匹配)。

懒惰的量词-以相似的方式工作，除了反向操作之外。他们想匹配的字符越少越好，他们做同样的事情，一个接一个地添加更多的字符，直到模式的其余部分有匹配的机会

但是根据我阅读的这篇文章，贪婪和懒惰量词的这些看似相同的过程是不同的-仅懒惰量词需要“回溯”。但是，在吐出先前吞咽的元素时，贪婪的量词也不需要“回溯”吗？

为什么会这样呢？看起来太直观了

最佳答案

贪婪和惰性的量词在正确应用时同样(便宜)。但是，懒惰的量词因其速度慢而享有盛誉，因为它们可以并且经常被用于补偿模式中的不精确性。

考虑一个简单的示例:<.*?>与<.*>。

当两个表达式都应用于相同的输入时

<abcdefghijklmnopqrstuvwxyz0123456789>

它们匹配完全相同的文本。区别仅在于它们到达比赛的方式:“惰性”表达式尝试越来越长的字符串，在40步后到达比赛( demo 1)。另一方面，贪婪的表达会一直进行到最后，只有5步( demo 2)后退一次即可到达比赛。

请注意，如果在 >之后添加更多字符，则情况可以逆转:

<abcdefghijklmnopqrstuvwxyz0123456789>abcdefghijklmnopqrstuvwxyz0123456789abcdefghijklmnopqrstuvwxyz0123456789abcdefghijklmnopqrstuvwxyz0123456789

现在，贪婪的表情变成了“慢速表情”，迈出了149个步骤( demo 3)，而懒惰的表情继续了与之前( demo 4)一样的40个步骤。

关于regex - 为什么贪婪的量词比懒惰的量词便宜，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35759287/

28

4

0

文章推荐： unity3d - Firebase for Unity3d Windows 应用

文章推荐： leaflet - 将FeatureGroup转换为GeoJson时，Leaflet Draw不采用属性

java - 在正则表达式中没有正确获得 * 量词？
我是正则表达式的新手，我正在浏览 the regex quantifier section .我对 * 量词有疑问。下面是 * 量词的定义: X* - 没有找到或找到多个字母 X .* - 任何字符序
coq:消除 forall 量词
我想证明以下定理: Theorem Frobenius (A: Set) (q: Prop) (p: A -> Prop) : (q \/ forall x : A, p x) -> (foral
regex - 量词 {0} 在某些情况下有意义吗？
例子: /(?:Foo){0}bar/ 我在另一个答案中看到了类似的内容。起初我想“那应该是什么”，但后来，“好吧，有点消极的看法”，所以 Foo之前不允许 bar ，但这不起作用。你可以看到这个
javascript - 正则表达式 - 连续使用 "+ "量词
添加/删除“+”不会改变输出。但我也没有收到任何错误。 “+”在这里做什么？ /.{3}+/g 最佳答案 “+”在这里无效，可能是你的意思 /(.{3})+/g 关于javascript - 正则表达
javascript - 正则表达式 "ignores"量词？
基本上我有以下字符串:http:/www.-woejfewiofjewow不允许匹配我的正则表达式:http://(www\.[^-])?[^-].* (我用 regexr.com 来检查它..)
c# - 正则表达式:很少匹配 * 量词
我的正则表达式以量词 * 结尾。但是我在字符串中几乎没有匹配项。我怎样才能让它仍然找到所有匹配项？我的正则表达式: ((CMD1|CMD2)+(?::|;)+.*) 测试字符串为"cmd1: test
javascript - 这两个正则表达式有什么区别？ (理解？量词)
关于Eloquent JavaScript这本书chapter 9: Regular Expressions在“解析 INI 文件”部分下有一个示例，其中包含一个我根本听不懂的正则表达式。作者正在尝试
haskell - 'uncurry' 是否有可能是一个 forall 量词？
假设我们有一个类型构造函数 f，它通过 DataKinds-promoted 对接受两种类型。 forall (f :: (ka, kb) -> *) 然后我可以实现一个函数 forward ，就像
haskell - QuickCheck 中是否有 "there exists"量词？
有forAll量词返回一个检查所有测试用例是否通过的属性。有没有办法定义一个“存在”量词，它返回一个属性来检查它至少一个测试用例是否通过？最佳答案通过枚举测试存在会更可靠:SmallCheck ,
javascript - JavaScript RegExp 中的困惑？量词
我可以知道以下代码的输出为:1,10,10 的原因吗？为什么不是这样:10, 10？ var str="1, 100 or 1000?"; var patt1=/10?/g; document.wr
C++ 正则表达式匹配 '+' 量词
我要匹配模式的表达式空格后跟(加法运算符或减法运算符) 例如:"+" 应该返回 True 我已经尝试在以下正则 exp 上使用 std::regex_match: "[+-]", "\\s[+-]"
regex - 'optional' 量词 ('??' ) 的惰性版本在正则表达式中有用吗？
我想不出我想使用 ?? 的情况在正则表达式中，但也许我想得还不够仔细。最佳答案也许是一个分隔符分隔的列表，并且您不想匹配任何终止分隔符。 ^((?:[^,]+,??)+),?$ 那将捕获 "a,b
c# - 解析 "*"- 量词 {x,y} 没有任何内容
当我尝试 Regex.Replace() 方法时失败。我该如何解决？ Replace.Method (String, String, MatchEvaluator, RegexOptions) 我试试
正则表达式{n,m}量词(至少n次，最多m次)
正则表达式{n,m}量词: {n,m}量词可以重复前面匹配的字符n-m次，至少n次，最多m次。语法结构: 构造函数方式: ?
haskell - 为什么 rank-n 类型需要显式的 forall 量词？
当我声明这个新类型时: newtype ListScott a = ListScott { unconsScott :: (a -> ListScott a -> r) -> r -> r }
Python RegEx - Negative Lookahead 在 a 之后不起作用？量词
我是正则表达式的新手，我想找到“po”的所有实例及其变体(即“p.o. | p.o. | p o”)后跟“box”的变体，因为我很感兴趣在采购订单中，而不是在邮政信箱中。下面的代码不起作用，即使它后面
c++ - 在 C++ 中重载 Subscript[] 运算符以设置类(量词)的大小。
大家好。我有以下结构和类， template struct Node { T DataMember; Node* Next; }; template class NCA {
scala - 在 specs2 框架中，为什么使用 Scope 会阻止执行 forAll 量词？
在下面的代码中，如何让 Specs2 执行第一个测试？ “print ones”测试在它应该失败的时候通过了。由于 new Scope，forAll() 部分中的代码未执行。 println 语句仅用

首页

博学

6Ren·AI

商城

regex - 为什么贪婪的量词比懒惰的量词便宜