gpt4 book ai didi

java - 使用 SAX (Java) 解析来自单个 TCP 流的多个 XML 消息

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:15:28 25 4
gpt4 key购买 nike

我现在使用 Java 连接到一个 TCP 端口,一个接一个地流式传输 XML 文档,每个文档都用 <?xml 分隔。文件标签的开始。演示格式的示例:

<?xml version="1.0"?>
<person>
<name>Fred Bloggs</name>
</person>
<?xml version="1.0"?>
<person>
<name>Peter Jones</name>
</person>

我正在使用 org.xml.sax.*接口(interface)。 SAX 解析适用于第一个文档,但在遇到第二个文档的开头时会抛出异常:

Exception in thread "main" org.xml.sax.SAXParseException: The processing instruction 
target matching "[xX][mM][lL]" is not allowed.

以下骨架类演示了我正在使用的设置:

import org.xml.sax.InputSource;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;

import java.io.FileReader;

public class XMLTest extends DefaultHandler {

public XMLTest() {
super();
}

public static void main(String[] args) throws Exception {
XMLReader xr = XMLReaderFactory.createXMLReader();

XMLTest handler = new XMLTest();
xr.setContentHandler(handler);
xr.setErrorHandler(handler);

xr.parse(new InputSource(new Socket("127.0.0.1", 4555).getInputStream()));
}
}

我无法控制 xml 的格式(这是一个财务数据馈送),但我需要能够有效地解析它,并解析所有文档。我花了整个下午/晚上尝试不同的事情,但都没有产生结果。任何帮助将不胜感激。

最佳答案

您想在每个 <?xml version="1.0"?> 上拆分流并分别解析它们。 BufferedReader可能对此有所帮助。启动示例:

reader = new BufferedReader(new InputStreamReader(input, "UTF-8"));
StringBuilder builder = null;
for (String line; (line = reader.readLine()) != null;) {
if (line.startsWith("<?xml")) {
if (builder != null) {
xr.parse(new InputSource(builder.toString()));
}
builder = new StringBuilder();
}
builder.append(line);
}

关于java - 使用 SAX (Java) 解析来自单个 TCP 流的多个 XML 消息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3302575/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com