gpt4 book ai didi

java - SAXParser 在遇到无效字符时不会抛出异常

转载 作者:行者123 更新时间:2023-12-01 05:30:45 27 4
gpt4 key购买 nike

如果我在 ansi xml 文件中放入一个 utf8 字符 » 并尝试使用 SAXParser 解析它,那么它的解析不会出现任何错误。为什么它没有抛出任何异常?

示例 xml 文件。保存为ansi编码。 Chrome 无法打开该文件,但 saxparser 解析它没有错误。

<?xml version="1.0" encoding="UTF-8"?>
<root date="2010-06-17">
<product
id="1 "
label= « xyz"/>
</root>

w3c xml validator也无法查看该文档。

最佳答案

该文档的结构可能仍然良好。

我尚未检查所有 ANSI 字符集,但 Windows-1252 中存在 » (U+00BB)。如果将 UTF-8 编码的字节序列 C2 BB 转储到 Windows-1252 编码文件中,它仍然是该编码的合法字节序列。 它将被视为字符序列 » (U+00C2 U+00BB)。

关于java - SAXParser 在遇到无效字符时不会抛出异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9036611/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com