gpt4 book ai didi

java - DJ原生swing jwebbrowser html解析错误

转载 作者:太空宇宙 更新时间:2023-11-04 15:18:44 27 4
gpt4 key购买 nike

我在 htmlparsing 时遇到错误。我认为问题源于引号 DjNative language=javascript error language="javascript"我尝试了所有版本的 Dj native 库

[ fatal error ] :2:18:与元素类型“语言”关联的属性“{1}”需要打开引号。org.xml.sax.SAXParseException;行号:2;列数:18;与元素类型“语言”关联的属性“{1}”需要打开引号。 在 com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(来源未知) 在 com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(来源未知)

  private Document HTMLtoXML(String source)
{
Document doc = null;
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder;
try {
builder = factory.newDocumentBuilder();
InputSource src = new InputSource(new StringReader(source));
doc = builder.parse(src);
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return doc;
}

public void StartTakip()
{
String htmlSource=webbrowser.getHTMLContent();
dc = HTMLtoXML(htmlSource);

}

当我尝试通过 DJNative Swing 获取页面源代码时 html 页面

<HTML>
<HEAD>
<SCRIPT language=javascript src="/medula/scripts/capFirstLetters.js"></SCRIPT>
<TITLE>deneme</TITLE>
</HEAD>
<BODY bgcolor=#233333>
</BODY>
</HTML>

如果源如下所示,html 解析工作正常

<HTML>
<HEAD>
<SCRIPT language="javascript" src="/medula/scripts/capFirstLetters.js"></SCRIPT>
<TITLE>deneme</TITLE>
</HEAD>
<BODY bgcolor="#233333">
</BODY>
</HTML>

最佳答案

我用 Jsoup-1.7.3.jar 解决了这个问题 例如:

  JWebBrowser jwebbrowser=new Jwebbrowser();
Document doc=Jsoup.parse(jwebbrowser.getHTMLContent);

关于java - DJ原生swing jwebbrowser html解析错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20637151/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com