gpt4 book ai didi

java - 使用撇号解析 XML

转载 作者:行者123 更新时间:2023-11-30 11:45:49 25 4
gpt4 key购买 nike

以BBC News RSS feed为例,他们的一条新闻如下:

<item><title>Pupils 'bullied on sports field'</title><description>bla bla..

我有一些 java 代码对此进行解析 - 然而,当标题包含撇号(如上)时,解析停止,所以我最终得到以下标题:Pupils ' 然后它继续打开并解析描述(这很好)。我如何让它解析完整的标题?以下是我解析信息的 for 循环中的一段代码:

                    NodeList title = element.getElementsByTagName("title");
Element line = (Element) title.item(0);
tmp.setTitle(getCharacterDataFromElement(line).toString());

完全相同的代码用于解析其他元素,如 description 和 pubDate 等,这些都很好。

这是 getCharacterDataFromElement 方法:

public static String getCharacterDataFromElement(Element e) {
Node child = ((Node) e).getFirstChild();
if (child instanceof CharacterData) {
CharacterData cd = (CharacterData) child;
return cd.getData();
}
return "";
}

我做错了什么?我使用 DocumentBuilder、DocumentBuilderFactory 和 org.w3c.dom 来处理 RSS 提要。

最佳答案

您的 getCharacterDataFromElement 只查看第一个子元素 - 查看是否还有其他子元素并将所有文本拼接在一起

HTH-DF

关于java - 使用撇号解析 XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10182514/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com