gpt4 book ai didi

Python:正则表达式按空格拆分(但在 [ ] 中保持元素未拆分)并在数组中添加 ""作为换行符号

转载 作者:太空宇宙 更新时间:2023-11-04 02:40:13 25 4
gpt4 key购买 nike

基本上想象一下,如果我有这样一行:

"Hello world
I am Lucas [help me]
Hi"

我希望 re.split() 的结果是:

['Hello' 'world' '' 'I' 'am' 'Lucas' '[help me] '' 'Hi']

截至目前,我已经尝试使用

re.split(r'\s+(?=[^()]*(?:\[|\<|$))', stringToSplit) 

但我不确定如何添加 '' 作为换行符。我试过:

result = re.split(r'\s|\n+(?=[^()]*(?:\[|\<|$))', input)

但是这会导致 [help me] 出现问题,因为它会将其拆分为 '[help' 和 'me]'。有什么解决办法吗?

最佳答案

您可以使用匹配方法提取方括号内的所有子字符串,或非空白 block ,或换行符前的空格

\[[^[]*]|\([^)]*\)|<[^>]*>|\S+|(?=\n)

参见 regex demo .

详情

  • \[[^]]*] - 一个 [后跟除 ] 以外的任何 0+ 个字符然后 ]
  • | - 或者
  • \([^)]*\) - 一个 (后跟除 ) 以外的任何字符然后 )
  • | - 或者
  • <[^>]*> - 一个 <后跟除 > 以外的任何 0+ 个字符然后 >
  • | - 或者
  • \S+ - 1 个或多个非空白字符
  • | - 或者
  • (?=\n) - \n 之前的空字符串, 换行符。

参见 Python demo :

re.findall(r"\[[^[]*]|\([^)]*\)|<[^>]*>|\S+|(?=\n)", s)
# => ['Hello', 'world', '', 'I', 'am', 'Lucas', '[help me]', '(help me 2)', '<help me 3>', '', 'Hi']

关于Python:正则表达式按空格拆分(但在 [ ] 中保持元素未拆分)并在数组中添加 ""作为换行符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46770225/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com