gpt4 book ai didi

java - 使用 XPath 提取和净化 XML 数据

转载 作者:太空宇宙 更新时间:2023-11-04 09:45:18 27 4
gpt4 key购买 nike

我想提取所有属性名称、ID 和值,因为数据需要导入到另一个系统中。

   <ATTRIBUTES>
<ATTRIBUTE NAME="TOLERANCE" ID="AT000"></ATTRIBUTE>
<ATTRIBUTE NAME="CHANGED_AT">
<VALUE>2019-01-31</VALUE>
</ATTRIBUTE>
<ATTRIBUTE NAME="CHANGED_BY" ID="AT002"></ATTRIBUTE>
<ATTRIBUTE NAME="WEIGHT_UNIT" ID="AT003">
<VALUE>kg</VALUE>
</ATTRIBUTE>
</ATTRIBUTES>

问题是 ATTRIBUTES/ATTRIBUTE/@IDATTRIBUTES/ATTRIBUTE/#VALUE 仅返回现有数据,并不指示没有 IDvalue 元素的节点。

我找到了related question ,有人搜索了不匹配或不存在的属性,但我无法翻译代码以满足我的需求。

如何使用 XPath 提取合理的数据来保持数据完整性?

最佳答案

我建议您使用 Jsoup-library 解析 xml。它的目的是在 html 上下文中读取 xml。它有多种方法可以通过CSS选择器、id、匹配属性值或反向匹配属性值、直接查找属性值等来查找元素。

只需使用 Jsoup.connect 方法连接到 URL。这将返回一个文档(J-soup 节点特化)。从那时起,您可以使用多种方法从文档中提取数据。

https://jsoup.org/

https://mvnrepository.com/artifact/org.jsoup/jsoup/1.8.3

关于java - 使用 XPath 提取和净化 XML 数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55494178/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com