gpt4 book ai didi

python - 使用正则表达式添加空组

转载 作者:太空宇宙 更新时间:2023-11-03 14:25:42 24 4
gpt4 key购买 nike

我是一名初学者Python程序员。我正在尝试使用正则表达式来构建组以附加到列表中。我不确定我想要做的事情是否可以用单个正则表达式来涵盖,或者我是否需要通过多个正则表达式传递文本。

测试数据:

亚达亚达0.003 40 40.00

亚达亚达亚55

yaaaaaaya100.0000 4

我的正则表达式:

(\w+ *\w* *\w*) (\d*\.*\d*) *(\d*\.*\d*) *(\d*\.*\d*)\n

我得到的组:

'亚达亚达','0.003','40','40.00'

'yadayada ya','55',空,空

'yaaaaaaya','100.0000','4',空

但是我想要的组是:

'亚达亚达','0.003','40','40.00'

'yadayada ya',空,空,'55'

'yaaaaaaya',空,'100.0000','4'

是否可以更改正则表达式以将空 (\d*.*\d*) 组引入到那些组少于 3 个的行中?那么数字组是“右对齐”的吗?

我尝试添加?到前两个 (\d*) 组的末尾,但得到相同的空组。

最佳答案

执行您通俗地描述为“右对齐”匹配的最简单方法,即。 e.优先匹配后面的可选子表达式,就是逆转可选组件的“贪婪”。在 Python 正则表达式中,这是通过向每个量化元素添加 ? 来完成的:

(\w+ *\w* *\w*) (\d*?\.*?\d*?) *?(\d*?\.*?\d*?) *?(\d*?\.*?\d*?)\n

请注意,您的表达非常自由,不会验证某些格式不良的输入。如果这对您有用,那就太好了,否则您可能需要考虑将某些部分粘贴在可选组中,例如 (|\d+(?:\.\d+)?) 来延迟匹配空格和例如,数字(构造 (|x) 相当于 ((?:x)??))。

编辑:正如蒂姆所指出的,这个正则表达式的缺点不仅仅是宽容,而且如果输入稍微有一点畸形,就可能引发灾难性的回溯。如果您打算坚持使用此方法,我会推荐一些更精确的方法:

(\w+(?: \w+){0,2}) (|\d+(?:\.\d+)?) ?(|\d+(?:\.\d+)?) ?(|\d+(?:\.\d+)?)\n

它仍然可以匹配格式错误的输入,但至少现在更严格了。

关于python - 使用正则表达式添加空组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47648166/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com