gpt4 book ai didi

python - 如何知道 Python 中文件的编码?

转载 作者:IT老高 更新时间:2023-10-28 20:26:38 25 4
gpt4 key购买 nike

有谁知道如何在 Python 中获取文件的编码。我知道您可以使用编解码器模块打开具有特定编码的文件,但您必须提前知道。

import codecs
f = codecs.open("file.txt", "r", "utf-8")

有没有办法自动检测文件使用了哪种编码?

提前致谢

编辑:感谢大家非常有趣的回答。您可能还对 http://whatismyencoding.com/ 感兴趣它基于 chardet(更多的站点是由 Bottle python 框架提供支持)

最佳答案

不幸的是,没有“正确”的方法可以通过查看文件本身来确定文件的编码。这是一个普遍的问题,不限于 python 或任何特定的文件系统。

如果您正在读取 XML 文件,文件中的第一行可能会提示您编码是什么。

否则,您将不得不使用一些基于启发式的方法,例如 chardet (其他答案中给出的解决方案之一)试图通过检查原始字节格式的文件中的数据来猜测编码。如果您使用的是 Windows,我相信 Windows API 还公开了尝试根据文件中的数据猜测编码的方法。

关于python - 如何知道 Python 中文件的编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2144815/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com