gpt4 book ai didi

python - Python 脚本在 Windows XP 上创建的文件名编码错误

转载 作者:可可西里 更新时间:2023-11-01 09:30:30 30 4
gpt4 key购买 nike

我的 Python 脚本在 Windows XP 下创建了一个 xml 文件,但该文件没有使用西类牙字符(例如“ñ”或一些重音字母)获得正确的编码。

首先,使用以下代码从 excel shell 读取文件名,我使用 xlrd 库读取 Excel 文件:

filename = excelsheet.cell_value(rowx=first_row, colx=5)

然后,我尝试了一些编码但没有成功生成具有正确编码的文件:

filename = filename[:-1].encode("utf-8")
filename = filename[:-1].encode("latin1")
filename = filename[:-1].encode("windows-1252")

使用“windows-1252”时,我得到了字母“ñ”、“í”和“é”的错误编码。例如,我得到的是 BAJO ARAGÓN_Alcañiz.xml 而不是 BAJO ARAGÓN_Alcañiz.xml

预先感谢您的帮助

最佳答案

您应该为您的文件名使用 unicode 字符串。一般操作系统支持包含任意 Unicode 字符的文件名。所以如果你这样做:

fn = u'ma\u00d1o'  # maÑo
f = open(fn, "w")
f.close()
f = open(fn, "r")
f.close()

它应该工作得很好。当您列出该文件所在目录的内容时,您在终端中看到的是不同的。如果终端的编码是 UTF-8,您将看到文件名 maño,但如果编码是例如 iso-8859-1,您将看到 maão。但即使您看到这些奇怪的字符,您也应该能够按照上述方式从 python 中打开文件。

综上所述,不对的输出进行编码

filename = excelsheet.cell_value(rowx=first_row, colx=5)

而是确保它是一个 unicode 字符串。

阅读 the Python Unicode HOWTOUnicode 文件名 部分|对你有帮助。

关于python - Python 脚本在 Windows XP 上创建的文件名编码错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13031705/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com