gpt4 book ai didi

java - XMLStreamReader 问题

转载 作者:行者123 更新时间:2023-11-30 11:56:48 26 4
gpt4 key购买 nike

我正在使用 javax.xml 中的 XMLStreamReader 接口(interface)来解析 XML 文件。该文件包含巨大的数据量和几个 KB 的单个文本节点。

验证和读取通常效果很好,但我在处理大于 15k 个字符的文本节点时遇到了问题。问题出现在这个函数中

String foo = "";
if (xsr.getEventType() == XMLStreamConstants.CHARACTERS) {
foo = xsr.getText();
xsr.next(); // read next tag
}
return foo;

xsr 是流阅读器。在此特定情况下,文本节点中的文本长度为 53'337 个字符(但有所不同),但是 xsr.getText() 方法仅返回其中的前 15'537 个字符。当然,我可以遍历该函数并连接字符串,但不知何故,我认为这不是我的想法...

我没有在文档或其他任何地方找到任何关于此的内容。这是有意的行为还是有人可以确认/否认它?我是否以某种方式错误地使用了它?

谢谢

最佳答案

Of course I could loop over the function and concatenate the strings, but somehow I don't think that's the idea...

实际上,就是的想法:)

解析器可以随意分解事件流,只要它与原始文档一致即可。这意味着它可以并且经常会将您的文本数据分解为多个事件。它如何以及何时选择这样做是解析器内部的实现细节,并且基本上是不可预测的。

是的,如果您收到多个连续的 CHARACTERS 事件,您需要手动附加它们。这是您为低级 API 支付的价格。

关于java - XMLStreamReader 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4184572/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com