gpt4 book ai didi

java - 为什么 org.apache.xerces.parsers.SAXParser 不跳过 utf8 编码的 xml 中的 BOM?

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:07:30 32 4
gpt4 key购买 nike

我有一个 utf8 编码的 xml。而这个文件包含了BOM文件的开头。所以在解析过程中我遇到了 org.xml.sax.SAXParseException: Content is not allowed in prolog.我无法从文件中删除这 3 个字节。我无法将文件加载到内存中并在此处删除它们(文件很大)。因此,出于性能原因,我正在使用 SAX 解析器,如果它们出现在 ""标记之前,我只想跳过这 3 个字节。我应该为此继承 InputStreamReader 吗?

我是 Java 新手 - 请告诉我正确的方法。

最佳答案

这个以前出现过,我找到了the answer当它发生在我身上时,在 Stack Overflow 上。链接的答案使用 PushbackInputStream 来测试 BOM。

关于java - 为什么 org.apache.xerces.parsers.SAXParser 不跳过 utf8 编码的 xml 中的 BOM?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5353783/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com