gpt4 book ai didi

python - 如何使用python读取从网络复制到txt文件的文本

转载 作者:太空宇宙 更新时间:2023-11-03 16:46:40 29 4
gpt4 key购买 nike

我正在学习如何读取文本文件。我用的是这样的方法:

f=open("sample.txt")

print(f.read())

如果我自己输入txt文件,效果很好。但是当我从网络上的新闻文章中复制文本时,它产生了以下错误:

UnicodeEncodeError: 'charmap' codec can't encode charater '\u2014' in position 738: character maps to undefined

我尝试将 Notepad++ 中的编码设置更改为 UTF-8,因为我在某处读到了这个原因

我也尝试过使用:

f=open("sample.txt",encoding='utf-8')

来自 here

但是还是不行。

最佳答案

您正在使用 Windows 并尝试打印到控制台。 print() 抛出异常。

Windows 控制台本身仅支持 8 位代码页,因此您所在区域之外的任何内容都将崩溃(尽管人们对 chcp 65001 有何评价)。

您需要安装并使用https://github.com/Drekin/win-unicode-console 。该模块在低级别与控制台 API 进行对话,为输入和输出提供对多字节字符的支持。

或者,不要打印到控制台并将输出写入使用编码打开的文件。例如:

with open("myoutput.log", "w", encoding="utf-8") as my_log:
my_log.write(body)

确保使用正确的编码打开文件。

关于python - 如何使用python读取从网络复制到txt文件的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36236066/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com