gpt4 book ai didi

java - 将 XHTML 嵌入到 XML 中

转载 作者:太空宇宙 更新时间:2023-11-04 12:53:08 24 4
gpt4 key购买 nike

我正在尝试将 XHTML 嵌入到 XML 节点中,如下所示:

<entry xmlns="http://www.w3.org/2005/Atom">
...
<content type="xhtml">
<div xmlns="http://www.w3.org/1999/xhtml">
<p>some text</p>
</div>
</content>
...
</entry>

我期望得到:

<div xmlns="http://www.w3.org/1999/xhtml">
<p>some text</p>
</div>

但我得到的是:

some text

这是我到目前为止的代码:

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(true);
DocumentBuilder db = factory.newDocumentBuilder();
Document doc = db.parse(methodeArticleXml);

System.out.println(doc.getElementsByTagName("content").item(0).getTextContent());

解析器将内容视为 XML,而不是 XHTML 或纯文本,有办法解决这个问题吗?

我无法更改文档的格式,因此不能选择使用 CDATA。

最佳答案

这是一个使用正则表达式的黑客

Pattern pattern = Pattern.compile("<content[^>]*>(.*?)</content>", Pattern.DOTALL);
Matcher matcher = pattern.matcher(xml);
while (matcher.find()) {
String content = matcher.group(1);
doStuff(content);
}

关于java - 将 XHTML 嵌入到 XML 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35632930/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com