gpt4 book ai didi

xml-parsing - publicId 和 systemId 之间需要空格,但 XML 看起来没问题

转载 作者:行者123 更新时间:2023-12-05 08:50:48 27 4
gpt4 key购买 nike

我刚刚拿出了几个月前写的一段代码。该代码从 Web 服务器获取 XML 文档并使用 JAXB 对其进行解析。我上次尝试时它完美无缺;现在我得到一个异常(exception):

org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 50; White spaces are required between publicId and systemId.
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:339)
at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:121)

环顾四周,这表明 XML header 数据存在一些问题,即 <!DOCTYPE ...> .答案表明该声明具有误导性:在所描述的情况下,systemId 完全丢失,尽管错误只是提示它前面缺少空格。

但是,如果我使用网络浏览器获取 XML 文档,它甚至不包含 <!DOCTYPE ...>标题。

解析我几个月前检索到的 XML 文档没有问题。

如果我将今天检索到的文档与几个月前检索到的文档进行比较,则两者在根元素开始之前完全相同。

最佳答案

捕获 HTTP 流量最终提供了答案(未加密的连接有时会派上用场):显然该服务在过去几个月内从 HTTP 切换到 HTTPS,否则 URL 保持不变。

对旧 URL 的请求用 301 Moved Permanently 和新 URL 来回答。

当使用 java.net.URL.openStream() 读取 URL 时,不会自动遵循重定向。因此,它返回的数据不是有效的 XML,从而导致出现错误消息。

今天的经验教训:publicId 和 systemId 之间需要空格 实际上只是一种隐晦的说法:您提供的 XML 数据有问题,但我们没有费心进行更深入的挖掘。

关于xml-parsing - publicId 和 systemId 之间需要空格,但 XML 看起来没问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61275561/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com