gpt4 book ai didi

java - 如何在一个文档中解析多个连续的 xml 文件?

转载 作者:行者123 更新时间:2023-11-29 06:24:04 25 4
gpt4 key购买 nike

我有一个大文本文件,它是一系列 XML 有效文档,看起来像这样:

<DOC>
<TEXT> ... </TEXT>
...
</DOC>
<DOC>
<TEXT> ... </TEXT>
...
</DOC>

等没有 <?xml version="1.0"> , <DOC></DOC>分隔每个单独的 xml。在 Java 中解析它并获取 <TEXT> 下的值的最佳方法是什么?在每个<DOC>

如果我将整个内容传递给 DocumentBuilder,我会收到一条错误消息,指出文档格式不正确。有没有比简单遍历更好的解决方案,为每个 <DOC> 构建一个字符串?

最佳答案

有效 XML 文档必须有一个 root 元素,您可以在该元素下指定所有其他元素。此外,在一个文档中只能出现一个 root 元素。看看XML Specification (see point 2)

因此,为了解决您的问题,您可以将文本文件的所有内容放入一个字符串(或 StringBuffer/StringBuilder...)并将此字符串放在 <root> 之间和 </root>标签例如,

String origXML = readContentFromTextFile(fileName);
String validXML = "<root>" + origXML + "</root>";
//parse validXML

关于java - 如何在一个文档中解析多个连续的 xml 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5946064/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com