- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
正在处理 this answer我偶然发现了 Python 的重复正则表达式异常。
假设我得到一个 CSV 字符串,其中包含任意数量的带引号和不带引号的元素:
21, 2, '23.5R25 ETADT', 'description, with a comma'
我想用 '\t'
替换所有 ','
的外部引号。所以我想要一个输出:
21\t2\t'23.5R25 ETADT'\t'description, with a comma'
由于字符串中自然会有多个匹配项,因此我将使用 g
正则表达式修饰符。我将使用的正则表达式将匹配引号外的字符或后跟 ','
的引号字符串:
('[^']*'|[^',]*),\s*
我将替换为:
\1\t
现在的问题是正则表达式是搜索而不是匹配,所以它可以选择跳过字符直到它可以匹配。所以我得到的不是我想要的输出:
21\t2\t'23.5R25 ETADT'\t'description\twith a comma'
您可以在此处查看此行为的实例:https://regex101.com/r/sG9hT3/2
g
修改后的正则表达式以在上一个匹配项之后的字符处开始匹配?对于那些熟悉 Perl 强大的正则表达式的人来说,Perl 提供了 \G
.这允许我们检索最后一个匹配位置的结尾。所以在 Perl 中我可以用正则表达式完成我所要求的:
\G('[^']*'|[^',]*),\s*
这会在最终引用的元素中造成不匹配。因为不是让正则表达式实现找到正则表达式与 \G
匹配的点,而是强制它从 第一个 字符开始匹配:
'description, with a comma'
最佳答案
您可以将以下正则表达式与 re.search
一起使用:
,?\s*([^',]*(?:'[^']*'[^',]*)*)
参见 regex demo (我将其更改为 ,?[ ]*([^',\n]*(?:'[^'\n]*'[^',\n]*)*)
因为这是一个多行演示)
在这里,正则表达式匹配(在单词的正则表达式含义中)...
,?
- 1 或 0 个逗号\s*
- 0 个或更多空格 ([^',]*(?:'[^']*'[^',]*)*)
- 第 1 组存储捕获的文本,包含...
[^',]*
- 除了 ,
和 '
(?:'[^']*'[^',]*)*
- 0 个或多个 ...
'[^']*'
- 类似 'string'
的不包含撇号的子字符串[^',]*
- 除了 ,
和 '
之外的 0 个或多个字符。如果您想使用 re.match
并将捕获的文本存储在捕获组中,这是不可能的,因为 Python 正则表达式引擎不会像 .NET 正则表达式引擎那样将所有捕获存储在堆栈中与 CaptureCollection
一起执行。
此外,Python 正则表达式不支持 \G
运算符,因此您不能在此处成功匹配的末尾锚定任何子模式。
作为替代方案/解决方法,您可以使用以下 Python 代码返回连续的匹配项,然后返回字符串的其余部分:
import re
def successive_matches(pattern,text,pos=0):
ptrn = re.compile(pattern)
match = ptrn.match(text,pos)
while match:
yield match.group()
if match.end() == pos:
break
pos = match.end()
match = ptrn.match(text,pos)
if pos < len(text) - 1:
yield text[pos:]
for matched_text in successive_matches(r"('[^']*'|[^',]*),\s*","21, 2, '23.5R25 ETADT', 'description, with a comma'"):
print matched_text
参见 IDEONE demo ,输出为
21,
2,
'23.5R25 ETADT',
'description, with a comma'
关于python - 最后一场比赛结束的 anchor ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33414028/
这个问题在这里已经有了答案: “return” and “try-catch-finally” block evaluation in scala (2 个回答) 7年前关闭。 为什么method1返
我有一个动态列表,需要选择最后一项之前的项目。 drag your favorites here var lastLiId = $(".album
我想为每个线程执行特定操作,因此,我认为tearDown Thread Group 不起作用。 是否有任何替代方法可以仅在线程的最后一次迭代时运行“仅一次 Controller ”? 谢谢。 最佳答案
在我的书中它使用了这样的东西: for($ARGV[0]) { Expression && do { print "..."; last; }; ... } for 循环不完整吗?另外,do 的意义何
我想为每个线程执行特定操作,因此,我认为tearDown Thread Group 不起作用。 是否有任何替代方法可以仅在线程的最后一次迭代时运行“仅一次 Controller ”? 谢谢。 最佳答案
有没有可能 finally 不会被调用但应用程序仍在运行? 我在那里释放信号量 finally { _semParallelUpdates.Re
我收藏了 对齐的元素,以便它们形成两列。使用 nth-last-child 的组合和 nth-child(even) - 或任何其他选择器 - 是否可以将样式应用于以下两者之一:a)最后两个(假设
我正在阅读 Jon Skeet 的 C# in Depth . 在第 156 页,他有一个示例, list 5.13“使用多个委托(delegate)捕获多个变量实例化”。 List list = n
我在 AM4:AM1000 范围内有一个数据列表(从上到下有间隙),它总是被添加到其中,我想在其中查找和总结最后 4 个结果。但我只想找到与单独列相对应的结果,范围 AL4:AL1000 等于单元格
我最近编写了一个运行良好的 PowerShell 脚本 - 然而,我现在想升级该脚本并添加一些错误检查/处理 - 但我似乎被第一个障碍难住了。为什么下面的代码不起作用? try { Remove-
这个问题在这里已经有了答案: Why does "a == x or y or z" always evaluate to True? How can I compare "a" to all of
使用 Django 中这样的模型,如何检索 30 天的条目并计算当天添加的条目数。 class Entry(models.Model): ... entered = models.Da
我有以下代码。 public static void main(String[] args) { // TODO Auto-generated method stub
这个问题在这里已经有了答案: Why does "a == x or y or z" always evaluate to True? How can I compare "a" to all of
这个问题已经有答案了: Multiple returns: Which one sets the final return value? (7 个回答) 已关闭 8 年前。 我正在经历几个在工作面试中
$ cat n2.txt apn,date 3704-156,11/04/2019 3704-156,11/22/2019 5515-004,10/23/2019 3732-231,10/07/201
我可以在 C/C++ 中设置/禁用普通数组最后几个元素的读(或写)访问权限吗?由于我无法使用其他进程的内存,我怀疑这是可能的,但如何实现呢?我用谷歌搜索但找不到。 如果可以,怎样做? 因为我想尝试这样
我想使用在这里找到的虚拟键盘组件 http://www.codeproject.com/KB/miscctrl/touchscreenkeyboard.aspx就像 Windows 中的屏幕键盘 (O
我正在运行一个 while 循环来获取每个对话的最新消息,但是我收到了错误 [18-Feb-2012 21:14:59] PHP Warning: mysql_fetch_array(): supp
这个问题在这里已经有了答案: How to get the last day of the month? (44 个答案) 关闭 8 年前。 这是我在这里的第一篇文章,所以如果我做错了请告诉我...
我是一名优秀的程序员,十分优秀!