gpt4 book ai didi

python - 文件 I/O 隔离文本文件中的单词

转载 作者:行者123 更新时间:2023-11-30 23:26:20 26 4
gpt4 key购买 nike

我目前正在使用 python 2.7.5 进行文件读取作业。我们的第一个任务是读取提供给我们的两个文件(一个是故事,另一个是字典)。字典文件中每一行一个单词。然后,检查故事文件中的每个单词,看看它是否在字典中。如果是,我们就打印这个词。这是我的代码:

story = set(open("story.txt").read().strip().split("\n"))
dictionary = open("dictionary.txt").read().strip().split("\n")

for word in story:
word = word.strip(',():;.')
if word not in dictionary:
print(word)

我目前在获取故事中的每个单词时遇到问题,因为该程序正在从故事文件中输出各种行。我希望能得到一些帮助来找到故事中的每个单词。任何帮助表示赞赏。谢谢。

最佳答案

阅读故事时,只需使用split(),而不是split('\n'):

In [1]: '''This is a text.
...: There is also a second line.'''.split()
Out[1]: ['This', 'is', 'a', 'text.', 'There', 'is', 'also', 'a', 'second', 'line.']

第一个调用在所有空格上分割,第二个调用仅在换行符上分割。

在分割文本之前,最好删除标点符号;

with open('story.txt', 'r') as infile:
data = infile.read()
data = data.translate(None, ';:.,!?')
words = data.split()

关于python - 文件 I/O 隔离文本文件中的单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22595232/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com