gpt4 book ai didi

适用于UTF-16LE和UTF32-LE的Unicode BOM

转载 作者:行者123 更新时间:2023-12-04 05:05:30 28 4
gpt4 key购买 nike

似乎在用于UTF16-LE和UTF-32LE的字节顺序标记之间存在歧义。特别是,请考虑一个包含以下8个字节的文件:

FF FE 00 00 00 00 00 00

我怎么知道这个文件是否包含:
  • UTF16-LE BOM(FF FE),后跟3个空字符;或
  • UTF32-LE BOM(FF FE 00 00)后跟一个空字符吗?

  • Unicode BOMs的描述如下: http://unicode.org/faq/utf_bom.html#bom4,但是没有关于这种歧义的讨论。我想念什么吗?

    最佳答案

    顾名思义,BOM仅告诉您字节顺序,而不告诉您编码。您必须先知道编码是什么,然后才能使用BOM来确定多字节序列的最低有效字节还是最高有效字节。

    BOM的一个幸运的副作用是,有时您还可以使用它来猜测编码(如果您不知道的话),但这不是其设计目的,并且不能替代发送适当的编码信息。

    关于适用于UTF-16LE和UTF32-LE的Unicode BOM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1929962/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com