gpt4 book ai didi

python - 带有字节顺序标记的 UTF-16 大端编码

转载 作者:太空宇宙 更新时间:2023-11-04 02:59:12 24 4
gpt4 key购买 nike

我在记事本中创建了一个只有一个破折号的文件,并使用 Unicode (big endian) 编码保存了这个文件。在记事本中,这会显示一个破折号。当我打开文件并在 Python 3/IDLE 中像这样读取它时:

open(file_path, encoding="UTF-16-BE").read()

我明白了:

'\ufeff—'

以字节表示,文件内容是这样的:

b'\xfe\xff \x14'

它不应该是处理 BOM 而不是显示它吗?我查看了 Python 的可用编码,其中没有像 UTF_16_BE_SIGUTF_8_SIG 一样的东西。这是怎么回事,我该如何正确处理?

最佳答案

当您指定 UTF-16 的字节顺序时,您将禁用 BOM 检查。如果您希望编解码器检查并删除 BOM,请指定非字节序编解码器:

open(file_path, encoding="UTF-16").read()

关于python - 带有字节顺序标记的 UTF-16 大端编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41476579/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com