gpt4 book ai didi

python - 匹配逗号或换行符但不能同时匹配两者的正则表达式

转载 作者:行者123 更新时间:2023-11-28 20:09:37 27 4
gpt4 key购买 nike

我在使用以下 python 脚本时遇到问题,该脚本从公司内部 Web 应用程序文本区域的文本中提取了一些选项。

import re

text = 'option one\noption two, option three, option four'
correct = 'option one, option two, option three, option four'

pattern = re.compile('(\s*[,]\s*)')
fixed = pattern.sub(', ', text)

print fixed
option one
option two, option three, option four

print fixed.split(', ')
['option one\noption two', 'option three', 'option four']

这显然无法将“选项一\n选项二”拆分为“选项一”、“选项二”

所以输入最终可能是

option one
option two, option three, option four

需要转换成

option one, option two, option three, option four

如果是逗号就没问题

一个逗号后跟一个换行符

但如果它本身只是一个换行符则不是。

最佳答案

将您的字符类从 [,] 扩展到 [,\n],也许吧?另外,为什么不直接在正则表达式上拆分,而不是先搜索和替换然后拆分?此函数:http://docs.python.org/library/re.html?highlight=re.split#re.split可以派上用场。

关于python - 匹配逗号或换行符但不能同时匹配两者的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10446908/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com