gpt4 book ai didi

Python 正则表达式 re.split 使用特定单词作为分隔符

转载 作者:太空宇宙 更新时间:2023-11-04 10:39:45 25 4
gpt4 key购买 nike

我正在尝试对多个定界符进行 .split,所以我正在尝试使用 re.split()

我搜索过的其他示例使用\b 显示

text = "this and that;something.else\nand some more"
import re
items=re.split("[;|\.|\n|\b and \b]",text)
print items

这给出:

['this', '', '', '', '', 'th', 't', 'somethi', 'g', 'else', '', '', ' ', '', '一些', '更多']

我希望它使用 "和 " 作为分隔符并给出:

['this', 'that', 'something', 'else', 'and some more']

最佳答案

因为你想获取单词尝试使用负字符类:

items = re.split(" and |[^a-zA-Z ]+",text)

注意:写 [;|\.|\n|\b and\b] 是没有意义的。字符类就像一个袋子,你可以在其中放置无序的单个字符,不能放置单词(有序字符),也不能将断言作为单词边界。 在字符类中 | 被视为文字,没有特殊含义。您的字符类与 [abdn ;.|]

完全相同

关于Python 正则表达式 re.split 使用特定单词作为分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21345371/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com