- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在令人敬畏的正则表达式模块 (https://pypi.python.org/pypi/regex) 的 pypi 页面中指出\G 可以“在负的可变长度后视中使用以限制后视的距离”。非常有趣,但该页面没有给出任何示例,当我尝试想象一个时,我的白带 regex-fu 简直令人窒息。
谁能描述一些示例用例?
最佳答案
这是一个使用 \G
的例子和创造性的消极回顾:
regex.match(r'\b\w+\b(?:\s(\w+\b)(?<!\G.*\b\1\b.*\b\1\b))*', words)
words
应该是由单个空格分隔的字母数字字符串,例如 "a b c d e a b b c d"
.
该模式将匹配一系列独特的单词。
\w+
- 匹配第一个词。(?:\s(\w+\b) )*
- 匹配附加词 ...(?<!\G.*\b\1\b.*\b\1\b)
- ...但是对于添加的每个新词,检查它在我们到达 \G
之前是否已经出现.模式末尾的回顾,限制在 \G
可以断言当前匹配的另一个条件,否则这是不可能的。基本上,该模式是 using lookaheads for AND logic in regular expressions 的变体。 , 但不限于整个字符串。
这是一个 working example在 .Net 中,具有相同的功能。
使用 findall
在 Python 2 中尝试相同的模式和 regex
模块给我一个段错误,但是 match
似乎有效。
关于python - "use\G in negative variable-length lookbehinds to limit how far back the lookbehind goes"示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27562751/
我正在寻找一个正则表达式来在 : 字符上拆分用户提供的字符串,但当用户转义冒号 \: 或者它是 url 的一部分时则不会,例如https://stackoverflow..。在 javascript
我试图让正则表达式以负向后视的方式捕获一些数据,这样如果某个字符串在它前面,它就不会匹配。我知道有两种基本格式,但都不起作用。 我在搜索应用程序中执行此操作,无法使用 java 进行扩充,因此解决方案
我有这个目标: 给定字符串:"Part1-part2-part3-part4-part5" 在第二次出现“-”时拆分它, 所以我期待一个数组 [ "Part1-part2", "part3-part4
我正在为此寻找替代方案: (?x[1]); 编辑: 要使用您当前的规范从 str.123 中删除 3,请使用相同的捕获 方法:捕获您需要的内容并恢复使用替换模式中的 $n 反向引用在结果中捕获的文本,
我正在为此寻找替代方案: (?x[1]); 编辑: 要使用您当前的规范从 str.123 中删除 3,请使用相同的捕获 方法:捕获您需要的内容并恢复使用替换模式中的 $n 反向引用在结果中捕获的文本,
这个问题在这里已经有了答案: Javascript Regex Lookbehind Alternative (2 个答案) 关闭 4 年前。 我正在匹配下面描述的三种模式,它们都是独立的。按照超链
在令人敬畏的正则表达式模块 (https://pypi.python.org/pypi/regex) 的 pypi 页面中指出\G 可以“在负的可变长度后视中使用以限制后视的距离”。非常有趣,但该页面
我正在尝试使用 tidyr 中的 extract 函数进行一些模式匹配。我已经在正则表达式练习网站上测试了我的正则表达式,该模式似乎有效,而且我正在使用 lookbehind assertion。 我
我需要在我的语料库中搜索诸如game 或shame 之类的词,但我想指定搜索以排除三个字符串 a game/a shame or , A game/A shame and a/an/A/An WORD
我试图在公式中替换所有缺少前面零的 float 。例如: “4+.5”应该变成:“4+0.5” 现在我读到 JavaScript 不支持向后看,那么我该如何实现呢?当前面有数字时,以下代码也会替换:
Javascript 中的 lookbehind regexps 有几种(有时是棘手的)解决方案。但是,这是最简单的方法,如果我需要一个零宽度! 使用全局搜索查看表达式,这可能会重叠。例如。使用 /(
更新的问题 假设字符串 "?foo=bar&nonfoo=bar&foo=bar" ,在这种情况下我需要捕获: foo=bar foo=foo 我用 Perl 做的, see here . 但是Jav
我需要捕获以 # 开头的所有行JavaScript 中的字符。我尝试使用类似以下正则表达式的内容,但事实证明 JavaScript 不支持积极的后向断言 (?<=) . /(?<=\n)\#[^\n]
我想将某些文件类型(例如“.txt”)与不以特定子字符串结尾的非空根名称(例如“-bad”)匹配。有了负后视支持,解决方案很简单: /.(? ((regex.test(input) === expec
我在 .net 中有一个字符串。 Para 1Para 2Para 3Para 4 现在,我只想获取标签 p 内的文本(Para 1、Para 2、Para 3、Para4)。 我使用了以下正则表达式
我有一个包含多个关键字的字符串。我想将字符串拆分为这些关键字的列表(但保留关键字,因为它们确定了以下数据的含义) 以下面的字符串为例: test_string = "ªttypmp3pfilfDjTu
如何让lookbehind变得贪婪? 在这种情况下,我希望后向处理消耗 : if is 存在。 m = Regex.Match("From: John", @"(?i)(?<=from:)....")
我想捕捉不带空格的单词。 var paragraphy="Apple banana kişiler ki örnek foo."; var word="kişiler"; var regex = ne
我正在尝试匹配以 .xsd 结尾但不以 form.xsd 结尾的字符串列表,我使用以下正则表达式: ArrayList files = new ArrayList(); files.add("/aba
此问题特定于 Java 7/8。 使用量词的相当复杂的正则表达式在像这样的后向断言中是被禁止的: (?<=(a|b*)*)bc 因为它会导致运行时异常并显示如下消息: look-behind grou
我是一名优秀的程序员,十分优秀!