- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
正在处理 this answer我偶然发现了 Python 的重复正则表达式异常。
假设我得到一个 CSV 字符串,其中包含任意数量的带引号和不带引号的元素:
21, 2, '23.5R25 ETADT', 'description, with a comma'
我想用 '\t'
替换所有 ','
的外部引号。所以我想要一个输出:
21\t2\t'23.5R25 ETADT'\t'description, with a comma'
由于字符串中自然会有多个匹配项,因此我将使用 g
正则表达式修饰符。我将使用的正则表达式将匹配引号外的字符或后跟 ','
的引号字符串:
('[^']*'|[^',]*),\s*
我将替换为:
\1\t
现在的问题是正则表达式是搜索而不是匹配,所以它可以选择跳过字符直到它可以匹配。所以我得到的不是我想要的输出:
21\t2\t'23.5R25 ETADT'\t'description\twith a comma'
您可以在此处查看此行为的实例:https://regex101.com/r/sG9hT3/2
g
修改后的正则表达式以在上一个匹配项之后的字符处开始匹配?对于那些熟悉 Perl 强大的正则表达式的人来说,Perl 提供了 \G
.这允许我们检索最后一个匹配位置的结尾。所以在 Perl 中我可以用正则表达式完成我所要求的:
\G('[^']*'|[^',]*),\s*
这会在最终引用的元素中造成不匹配。因为不是让正则表达式实现找到正则表达式与 \G
匹配的点,而是强制它从 第一个 字符开始匹配:
'description, with a comma'
最佳答案
您可以将以下正则表达式与 re.search
一起使用:
,?\s*([^',]*(?:'[^']*'[^',]*)*)
参见 regex demo (我将其更改为 ,?[ ]*([^',\n]*(?:'[^'\n]*'[^',\n]*)*)
因为这是一个多行演示)
在这里,正则表达式匹配(在单词的正则表达式含义中)...
,?
- 1 或 0 个逗号\s*
- 0 个或更多空格 ([^',]*(?:'[^']*'[^',]*)*)
- 第 1 组存储捕获的文本,包含...
[^',]*
- 除了 ,
和 '
(?:'[^']*'[^',]*)*
- 0 个或多个 ...
'[^']*'
- 类似 'string'
的不包含撇号的子字符串[^',]*
- 除了 ,
和 '
之外的 0 个或多个字符。如果您想使用 re.match
并将捕获的文本存储在捕获组中,这是不可能的,因为 Python 正则表达式引擎不会像 .NET 正则表达式引擎那样将所有捕获存储在堆栈中与 CaptureCollection
一起执行。
此外,Python 正则表达式不支持 \G
运算符,因此您不能在此处成功匹配的末尾锚定任何子模式。
作为替代方案/解决方法,您可以使用以下 Python 代码返回连续的匹配项,然后返回字符串的其余部分:
import re
def successive_matches(pattern,text,pos=0):
ptrn = re.compile(pattern)
match = ptrn.match(text,pos)
while match:
yield match.group()
if match.end() == pos:
break
pos = match.end()
match = ptrn.match(text,pos)
if pos < len(text) - 1:
yield text[pos:]
for matched_text in successive_matches(r"('[^']*'|[^',]*),\s*","21, 2, '23.5R25 ETADT', 'description, with a comma'"):
print matched_text
参见 IDEONE demo ,输出为
21,
2,
'23.5R25 ETADT',
'description, with a comma'
关于python - 最后一场比赛结束的 anchor ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33414028/
鉴于我使用 matches!宏观 当我尝试将它与枚举一起使用时 然后它显示出意想不到的行为。 请参阅以下最小示例,playground 中也提供了该示例 pub enum Test { FIR
鉴于我使用 matches!宏观 当我尝试将它与枚举一起使用时 然后它显示出意想不到的行为。 请参阅以下最小示例,playground 中也提供了该示例 pub enum Test { FIR
我使用 pcrecpp c++ (PCRE lib) 我需要循环获取所有匹配项。我该怎么做? 例如模式: “你好” 和主题: “你好你好” 循环应该循环 3 次(因为 3 次匹配) 1 你好 2
循环赛算法在每场比赛只有团队相遇时工作正常。但是,如何在超过两支球队在同一场比赛中相遇的体育比赛或比赛中实现它。例如彩弹射击锦标赛,其中 2 到 n 个团队在 2 到 n 场比赛中相遇。仍然保持尽可能
http://ecoocs.org/contests/ecoo_2007.pdf 我正在为我所在地区即将举行的 ecoo regionals 学习,但我对这个问题感到困惑。我真的不知道从哪里开始。 它
如果有人可以帮助我使用二维数组概念而不是使用集合,那就太好了。因为我必须在这个逻辑中使用数组并获取输出。 问题: 第 1 组有四支球队,名称分别为(“A”、“B”、“C”、“D”)第 2 组有四支球队
我几乎正在尝试重新开始 JAVA 编程,只是需要一些我正在从事的小项目的指导。 差不多,我正在举办一场台球锦标赛,我希望每个玩家都能与每个玩家交手一次: 我创建了该程序( https://sconte
我遇到了这个问题,但无法想出解决方案。有一场 Frog 赛跑, Frog 有一定数量的有效跳步。它可以向前或向后移动。为了赢得比赛, Frog 必须尽可能靠近终点线,但不能越过终点线。 例子。6, 1
Closed. This question needs to be more focused。它当前不接受答案。
我正在为篮球赛季创建一个数据库。在这一点上,我保持简单,并存储表: -联盟 id[PK], name->(NBA, NCAAM, etc) -年 id[PK], league_id[FK], year
我将在当前工作的网站上创建竞赛。每个比赛都不会相同,并且可能有不同数量的输入字段,用户必须输入这些字段才能成为比赛的一部分,例如。 比赛 1 可能只需要一个名字 比赛 2 可能需要名字、姓氏和电子邮件
我正在尝试执行一个查询,该查询可以返回 5 个条件中的大多数匹配的结果。但如果只有 5 场比赛中的 5 场比赛,则优先。 为了说明我的问题,已准备好以下 SQL。 declare @tmp table
我已将所有 Json 转换器放在一个文件 JsonUtil 中,然后有一个 ConvertToJson 方法,该方法尝试转换传递给 json 的任何对象。 基本上是这样的结构: implicit va
我是一名优秀的程序员,十分优秀!