gpt4 book ai didi

python re.split() : how to save some of the delimiters (instead of all the delimiter by using bracket)

转载 作者:太空宇宙 更新时间:2023-11-04 00:08:42 27 4
gpt4 key购买 nike

对于句子:

"I am very hungry,    so mum brings me a cake!

我希望它被分隔符分割,我希望除了空格之外的所有分隔符也被保存。所以预期的输出是:

"I"  "am"  "very"  "hungry"   ","   "so", "mum"  "brings"  "me"   "a"   "cake"    "!"    "\n"

我目前正在做的是 re.split(r'([!:''".,(\s+)\n])', text),它将整个句子拆分但是还保存了很多我不想要的空格字符。我还尝试了正则表达式 \s|([!:''".,(\s+)\n]) ,这不知何故给了我很多 None。

最佳答案

searchfindall 在这里可能比 split 更合适:

import re

s = "I am very hungry, so mum brings me a !#$#@ cake!"

print(re.findall(r'[^\w\s]+|\w+', s))

# ['I', 'am', 'very', 'hungry', ',', 'so', 'mum', 'brings', 'me', 'a', '!#$#@', 'cake', '!']

模式 [^\w\s]+|\w+ 表示:既不是字母数字也不是空格的符号序列或字母数字序列(即单词)

关于python re.split() : how to save some of the delimiters (instead of all the delimiter by using bracket),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53238662/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com