gpt4 book ai didi

python - 两个字符串python之间的正则表达式文本

转载 作者:太空狗 更新时间:2023-10-30 02:29:12 24 4
gpt4 key购买 nike

我有一些这样的文字:

CustomerID:1111,

text1

CustomerID:2222,

text2

CustomerID:3333,

text3

CustomerID:4444,

text4

CustomerID:5555,

text5

每个文本有多行。

我想将客户 ID 和每个 ID 的文本存储在元组中(例如 (1111, text1)(2222, text2) 等)。

首先,我使用下面的表达式:

re.findall('CustomerID:(\d+)(.*?)CustomerID:', rawtxt, re.DOTALL)

但是,我只得到(1111, text1), (3333, text3), (5555, text5).... .

最佳答案

re.findall(r'CustomerID:(\d+),\s*(.*?)\s*(?=CustomerID:|$)', rawtxt, re.DOTALL)

Findall 只返回。使用 lookahead 来停止 non greedy 量词。它还建议使用 rraw 模式来指定你的正则表达式。如果您不使用 lookahead,则下一场比赛的 customerid 将被消耗,因此下一场比赛将不会出现。必须使用 lookahead< 删除重叠比赛 不消耗 string

关于python - 两个字符串python之间的正则表达式文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33795309/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com