gpt4 book ai didi

python - 如何将 LF 转换为 CRLF?

转载 作者:太空狗 更新时间:2023-10-29 20:33:04 25 4
gpt4 key购买 nike

我在网上找了一个大部分英文单词的列表,但是换行符是unix风格的(Unicode编码:UTF-8)。我在这个网站上找到它:http://dreamsteep.com/projects/the-english-open-word-list.html

如何将换行符转换为 CRLF,以便我可以遍历它们?我将在其中使用它们的程序遍历文件中的每一行,因此每行必须有一个单词。

这是文件的一部分:bitbackbitebackbiterbackbitersbackbitesbackbitingbackbittenbackboard

应该是:

bit
backbite
backbiter
backbiters
backbites
backbiting
backbitten
backboard

如何将我的文件转换成这种类型?注意:它有 26 个文件(每个字母一个),总共 80,000 个单词(因此程序应该非常快)。

我不知道从哪里开始,因为我从未使用过 unicode。提前致谢!

使用 rU 作为参数(如建议的那样),在我的代码中使用:

with open(my_file_name, 'rU') as my_file:
for line in my_file:
new_words.append(str(line))
my_file.close()

我收到这个错误:

Traceback (most recent call last):
File "<pyshell#5>", line 1, in <module>
addWords('B Words')
File "D:\my_stuff\Google Drive\documents\SCHOOL\Programming\Python\Programming Class\hangman.py", line 138, in addWords
for line in my_file:
File "C:\Python3.3\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 7488: character maps to <undefined>

谁能帮我解决这个问题?

最佳答案

您应该能够使用 Python 的 universal newline support 打开文件,而不是进行转换。 :

f = open('words.txt', 'rU')

(注意 U。)

关于python - 如何将 LF 转换为 CRLF?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13954840/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com