gpt4 book ai didi

Python 正则表达式根据数字后面的逗号进行拆分

转载 作者:太空宇宙 更新时间:2023-11-04 03:21:14 25 4
gpt4 key购买 nike

我有一个大文件,我需要从中加载到一个字符串列表中。每个元素都将包含文本,直到紧跟在数字后面的“,”

例如:

this is some text, value 45789, followed by, 1245, and more text 78965, more random text 5252,

这应该变成:

["this is some text, value 45789", "followed by, 1245", "and more text 78965", "more random text 5252"]

我目前正在做re.sub(r'([0-9]+),','~', <input-string>)然后在“~”上拆分(因为我的文件不包含 ~)但这会抛出逗号前的数字。有什么想法吗?

最佳答案

您可以使用 re.splitpositive look-behind assertion :

>>> import re
>>>
>>> text = 'this is some text, value 45789, followed by, 1245, and more text 78965, more random text 5252,'
>>> re.split(r'(?<=\d),', text)
['this is some text, value 45789',
' followed by, 1245',
' and more text 78965',
' more random text 5252',
'']

关于Python 正则表达式根据数字后面的逗号进行拆分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34668217/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com