gpt4 book ai didi

python - 重新拆分后的空格字符

转载 作者:太空宇宙 更新时间:2023-11-03 13:33:03 25 4
gpt4 key购买 nike

这是我正在读入的 .txt 文件中的一行,我将其分配给 x:

x = "Wild_lions live mostly in “Africa”"
result = re.split('[^a-zA-Z0-9]+', x)

我最终得到:

['Wild', 'lions', 'live', 'mostly', 'in', 'Africa', ''] # (there's an empty space character as the last element)

为什么最后有一个空格?我意识到我可以只执行 result.remove(' ') 来摆脱空间,但对于大文件,我认为这会非常低效。

最佳答案

你不需要使用这个复杂的正则表达式来分割它,更简单的是:

result = re.split('\s+', x)
result
# ['Wild_lions', 'live', 'mostly', 'in', '“Africa”']

\s+将匹配任意数量的任意空格(制表符、空格、换行符等)。


如果您只需要按字母顺序匹配,最好使用 re.compilefindall .

myre = re.compile('[a-zA-Z]+')
myre.findall(x)
# ['Wild', 'lions', 'live', 'mostly', 'in', 'Africa']

关于python - 重新拆分后的空格字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43447808/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com