gpt4 book ai didi

python - 我如何在 PYTHON 中遍历文件中的单词?

转载 作者:太空宇宙 更新时间:2023-11-04 05:23:05 26 4
gpt4 key购买 nike

我有一个 .txt 文件,我想浏览其中的文字。我有一个问题,我需要在遍历单词之前删除标点符号。我试过这个,但它没有删除标点符号。

file=open(file_name,"r")
for word in file.read().strip(",;.:- '").split():
print word
file.close()

最佳答案

您当前方法的问题是 .strip() 并没有真正按照您的意愿行事。它会删除前导字符和尾随字符(并且您想删除文本中的字符),如果您想要指定除空格之外的字符,它们需要在列表中。

另一个问题是还有更多潜在的标点字符(问号、感叹号、unicode 省略号、破折号)不会被您的列表过滤掉。相反,您可以使用 string.punctuation 来获取范围广泛的字符(请注意 string.punctuation 不包含一些非英语字符,因此它的可行性可能取决于在您输入的来源上):

import string
punctuation = set(string.punctuation)
text = ''.join(char for char in text if char not in punctuation)

一个更快的方法(在 SO 上的 other answers 中显示)使用 string.translate() 来替换字符:

import string
text = text.translate(string.maketrans('', ''), string.punctuation)

关于python - 我如何在 PYTHON 中遍历文件中的单词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39726737/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com