gpt4 book ai didi

java - DocumentBuilder 给出 java.net.MalformedURLException : no !/in 规范

转载 作者:行者123 更新时间:2023-12-01 09:40:32 33 4
gpt4 key购买 nike

我的资源文件夹中有一个 XML 文件。这是我一直在尝试的:

首先从资源文件夹中获取文件:

ClassLoader classLoader = ParseXML.class.getClassLoader();
File file = new File(classLoader.getResource("sample.xml").getFile());

然后使用DOM解析来读取文件:

    DocumentBuilder dBuilder = null;
Document doc =null;
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
dBuilder = dbFactory.newDocumentBuilder();
doc = dBuilder.parse(file)

doc.getDocumentElement().normalize();
System.out.println("Root element :" + doc.getDocumentElement().getNodeName());

它一直给我“java.net.MalformedURLException:规范中没有!/”。我究竟做错了什么?

我也尝试这样做:

fileAsString = IOUtils.toString(classLoader.getResourceAsStream("sample.xml"));
doc = dBuilder.parse(new InputSource(new ByteArrayInputStream(fileAsString.getBytes("utf-8"))));

但错误保持不变。任何帮助将不胜感激。谢谢。

根据要求,包括堆栈跟踪:

java.net.MalformedURLException: no !/ in spec
at java.net.URL.<init>(Unknown Source)
at java.net.URL.<init>(Unknown Source)
at java.net.URL.<init>(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLEntityManager.setupCurrentEntity(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLEntityManager.startEntity(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLEntityManager.startDTDEntity(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDTDScannerImpl.setInputSource(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl$DTDDriver.dispatch(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl$DTDDriver.next(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl$PrologDriver.next(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentScannerImpl.next(Unknown Source)
at com.sun.org.apache.xerces.internal.impl.XMLDocumentFragmentScannerImpl.scanDocument(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XML11Configuration.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.XMLParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at com.northwestern.XMLParse.ParseXML.main(ParseXML.java:47)
Caused by: java.lang.NullPointerException: no !/ in spec
at sun.net.www.protocol.jar.Handler.parseAbsoluteSpec(Unknown Source)
at sun.net.www.protocol.jar.Handler.parseURL(Unknown Source)
... 18 more

最佳答案

根据您的评论,XML 文件包含此行:

<!DOCTYPE Policies PUBLIC "-//OpenSSO Policy Administration DTD//EN" "jar://com/sun/identity/policy/policyAdmin.dtd"> 

发生异常是因为 jar: URL 始终采用 jar: 形式jar-url !/ jar-entry-path,因此“jar://com/sun/identity/policy/policyAdmin.dtd”不是有效的 URL。有效 URL 的示例如下: jar: http://www.example.com/lib/dtds.jar!/com/sun/identity/policy/policyAdmin.dtd

当然,理想的解决方案是修复 XML 文件,或者告诉其作者修复它。但听起来你没有这个选项。

我要尝试的第一件事是通过添加 dbFactory.setFeature(XMLConstants.FEATURE_SECURE_PROCESSING, true); 来禁止系统 ID 的取消引用。在创建 DocumentBuilder 之前,添加到您的代码中。但是,正如您的评论所说,这似乎不起作用。

我接下来要尝试的是 dbFactory.setAttribute(XMLConstants.ACCESS_EXTERNAL_DTD, ""); ,尽管我怀疑该实现无论如何都会尝试将 DOCTYPE 的系统 ID 转换为 URL,这意味着 setAttribute 也无济于事。

这可能是某人错误地尝试将类路径资源指定为 URL(如果不知道包含的 .jar 文件的位置,则无法完成此操作)。您也许可以通过设置 EntityResolver 来解释他们的错误。 :

dBuilder.setEntityResolver(new EntityResolver() {
@Override
public InputSource resolveEntity(String publicID,
String systemID)
throws SAXException,
IOException {

if (systemID.startsWith("jar:") && !systemID.contains("!/")) {
String path = systemID.replaceFirst("^jar:/*", "/");
return new InputSource(ParseXML.class.getResourceAsStream(path));
}
return null;
}
});

关于java - DocumentBuilder 给出 java.net.MalformedURLException : no !/in 规范,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38488492/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com