java - XMLStreamReader 问题-6ren

java - XMLStreamReader 问题

转载作者：行者123 更新时间：2023-11-30 11:56:48

26

4

我正在使用 javax.xml 中的 XMLStreamReader 接口(interface)来解析 XML 文件。该文件包含巨大的数据量和几个 KB 的单个文本节点。

验证和读取通常效果很好，但我在处理大于 15k 个字符的文本节点时遇到了问题。问题出现在这个函数中

String foo = "";
if (xsr.getEventType() == XMLStreamConstants.CHARACTERS) {
    foo = xsr.getText();
    xsr.next(); // read next tag
}
return foo;

xsr 是流阅读器。在此特定情况下，文本节点中的文本长度为 53'337 个字符(但有所不同)，但是 xsr.getText() 方法仅返回其中的前 15'537 个字符。当然，我可以遍历该函数并连接字符串，但不知何故，我认为这不是我的想法...

我没有在文档或其他任何地方找到任何关于此的内容。这是有意的行为还是有人可以确认/否认它？我是否以某种方式错误地使用了它？

谢谢

最佳答案

Of course I could loop over the function and concatenate the strings, but somehow I don't think that's the idea...

实际上，就是的想法:)

解析器可以随意分解事件流，只要它与原始文档一致即可。这意味着它可以并且经常会将您的文本数据分解为多个事件。它如何以及何时选择这样做是解析器内部的实现细节，并且基本上是不可预测的。

是的，如果您收到多个连续的 CHARACTERS 事件，您需要手动附加它们。这是您为低级 API 支付的价格。

关于java - XMLStreamReader 问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4184572/

26

4

0

文章推荐： java - Java 中的透明度

文章推荐： javascript - 清除数组后不会更新 ng-options 绑定(bind)变量

文章推荐： Javascript - 如何检查一个字符串是否包含多个子字符串

文章推荐： java - 如何在 Java 中为 DAG 结构创建迭代器包装器？

java - XMLStreamReader - 文件末尾会发生什么？
像这样遍历 XML 文档时 while(streamReader.hasNext()){ streamReader.next(); if(streamReader.getEventTy
java - 用于打印的 XMLStreamReader
我正在使用 XMLStreamReader 读取 XML 文件并查找特定元素，然后更新相应的值。我的问题是有没有办法可以打印每个元素，包括文档的开头，例如: 每次我执行reader.next()？
java - XMLStreamReader 如何使用相同类型的嵌套元素
我正在使用 XMLStreamReader 并解析以下 XML: level0 level1
java - XmlStreamReader 未读取完整的文本值
正如我在 Reading escape characters with XMLStreamReader 中看到的那样，这个问题似乎以前曾出现过。但我在这里看到的问题略有不同。我正在读取一个相当大的
java - XMLStreamReader 无法读取完整标签
我正在使用 XMLStreamReader 解析 XML 。在标签有一些从数据库加载的数据(WebRowSet对象)。问题是这个标签的内容非常长(假设有几百KB——数据以Base64编码)，但是in
java - XmlStreamReader 在开始时行为随机
我希望 XmlStreamReader 从文档的开头启动(显然)，然后当我对其调用 next() 时跳转到 XML 文档的根目录。然而，可怕的是，我看到它跳转到第一个带有文本的标签，并且总是忽略根，并
java - XMLStreamReader 问题
我正在使用 javax.xml 中的 XMLStreamReader 接口(interface)来解析 XML 文件。该文件包含巨大的数据量和几个 KB 的单个文本节点。验证和读取通常效果很好，但我
java - XMLStreamReader 跳过没有属性的元素
我有一个 XMLStreamReader，当我仔细阅读 xml 时，它会跳过一个元素并转到下一个元素。我想按顺序阅读所有内容，因此这对我来说非常烦人并且破坏了我的解析。这是 XML: Cha
java - XMLStreamReader 和一个真正的流
更新 Java 社区中没有现成的 XML 解析器可以进行 NIO 和 XML 解析。这是我找到的最接近的，但不完整:http://wiki.fasterxml.com/AaltoHome 我有以下代码
java - 将字符串内容转换为 XMLStreamReader
你好我想知道如何将XML标签形式的字符串内容转换成XMLStreamReader 最佳答案您可以使用 XMLInputFactory.createXMLStreamReader , 传入 Strin
java - XMLStreamReader 编码
我的 XML 中有一些来自 Unicode 扩展 B 中文/日文/韩文的字符: 𠀀𠀁𠀂𠀃𠀄𪛔𪛕𪛖但是当我使用 streamReader.getText() 时它返回: ࠀ 有谁知道J
java - XMLStreamReader - 奇怪的错误
我有以下 XML 代码 medium weak 我使用以下代
Java XMLStreamReader 给出不需要的字符串
我有一些正在阅读的 xml。 website Tommy Jay
Java XMLStreamReader，当文本包含START_ELEMENT时如何获取元素文本
如果我有一个 XML 元素，例如: this is a title 使用 XMLStreamReader.getElementText() 很容易获取文本。但是，如果我遇到这样的元素，我无法弄清楚如何
Java XMLStreamReader 将“转换为”
假设我们有以下 XML "Hi" 我使用 XMLStreamReader 加载此 XML 并使用读取器对象进行解析。当我使用阅读器的 getText() 打印解析时遇到的字
java - 如何使用 XMLStreamReader 获取大文件的进度
我正在使用下面的代码使用 XMLStreamReader 读取 hadoop RecordReader 中的大型 xml 文件(以 GB 为单位) public class RecordReader
java - 如何获得 XMLStreamReader 的前瞻性？
我在XMLStreamReader中找不到任何peek或unread功能文档。例如，为了解析 HTML 列表中的子元素列表，获得至少一个标记前瞻的首选方法是什么？当我使用 ul 和
java - 如何过滤 StAX XMLStreamReader
我需要连接一个接收 StAX XMLStreamReader 作为输入的 API，并过滤提供的流(将某个属性的值从 true 更改为 false)。查看了 StreamReaderDelegate，
java - 为什么我的解码器要等到它具有以下开始元素才能使用 XMLStreamReader 返回？
我同时运行了 Python 脚本和 Java 测试。它们都试图做完全相同的事情——打开一个套接字，接收一个永无止境的 XML 流，并在接收到 XML 时对其进行解析。 Python 脚本使用 Expa
java - 使用 XMLStreamReader 转义字符
我正在使用 XMLStreamReader 读取 xml 文件。该文件包含以下形式的转义字符:Ã¼。在我看来，两个转义字符应该代表字符“ü”(UTF-8 编码？) 但 xml 流读取器创建以下字符

首页

博学

6Ren·AI

商城

java - XMLStreamReader 问题