gpt4 book ai didi

python - 将文件中的单词读入集合,维护顺序

转载 作者:太空宇宙 更新时间:2023-11-04 11:00:33 25 4
gpt4 key购买 nike

这里是 python 脚本中使用的一组 Unicode 单词。

texts =[u"abc", u"pqr", u"mnp"]

脚本在上面的 3 个单词示例中按预期工作。问题是文本文件中有数千个单词。我如何从文本文件中读取?

更新:我有两个问题。输出中不保留文本文件中的单词序列。文本文件具有 unicode 字符,因此在我的原始示例中是“u”。

# cat testfile.txt
Testing this file with Python

# cat test.py
#!/usr/bin/python
# -*- coding: utf-8 -*-

f = open('testfile.txt', 'r')
texts = set(f.read().split())
print (texts)

# python test.py
set(['this', 'Python', 'Testing', 'with', 'file'])

最佳答案

我看你的文件读取代码没有问题。考虑到单词出现在由空格分隔的文件中,并且文件不是太大而无法通过单个 read 吞噬,它应该可以正常工作。真正的问题是单词的顺序,如果您将它们塞入集合

如果您需要单词在文件中出现的顺序相同,为什么要使用 set?只需将它们保存在列表中即可。

如果您需要一个来删除重复项和/或其他目的,那么您有以下选择:

关于python - 将文件中的单词读入集合,维护顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5919631/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com