gpt4 book ai didi

python - 在python中使用正则表达式将文本文件拆分成单词

转载 作者:行者123 更新时间:2023-11-28 22:15:57 25 4
gpt4 key购买 nike

全新的 python !!!我得到了一个文本文件 https://en.wikipedia.org/wiki/Character_mask我需要将文件拆分成单个单词,(不止一个字母由一个或多个其他字符分隔)我试过使用正则表达式,但似乎无法正确拆分它而不会出错。这是我目前的代码,谁能帮我修复这个正则表达式

import re 
file = open("charactermask.txt", "r")
text = file.read()
message = print(re.split(',.-\d\c\s',text))
print (message)
file.close()

最佳答案

您可以使用带有以下正则表达式模式的 re.findall 来查找长度超过 1 个字符的所有单词。

改变:

message = print(re.split(',.-\d\c\s',text))

到:

message = re.findall(r'[A-Za-z]{2,}', text))

关于python - 在python中使用正则表达式将文本文件拆分成单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52510524/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com