gpt4 book ai didi

c# - 0xF8 是 UTF-8 编码的 XML 文档中的有效字节吗?

转载 作者:数据小太阳 更新时间:2023-10-29 02:00:03 25 4
gpt4 key购买 nike

我收到一份声称是 UTF-8 (<?xml version="1.0" encoding="UTF-8"?>) 的文件。我过去遇到过一些问题,发件人的编码声明并不是那么可靠(即文件被声明为具有给定的编码,而实际上它们没有),所以我尝试使用 http://utf8checker.codeplex.com/ 进行检查。根据这个工具,一个 0xF8 字节意味着这个文档不是 UTF-8 编码的。

然而,相反,this page列出了在 UTF-8 中表示为 0xF8 的挪威字符“ø”。 (该页面是挪威语,但是,我所指的数据来自页面底部的表格。)

谁能帮我解决这个问题?我在这里感到很困惑。

谢谢!

最佳答案

ø 是 U+00F8,因为它不是 ASCII,所以它不可能是单个 UTF-8 代码单元。它由 0xC3 0xB8 in UTF-8 表示.因此,如果 0xF8 单独出现在某个文档中,是的,它是无效的 UTF-8。

文档似乎使用 Latin-1 或 Windows 代码页 1252。

关于c# - 0xF8 是 UTF-8 编码的 XML 文档中的有效字节吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4808275/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com