gpt4 book ai didi

java - 在java中使用DOM解析非常大的XML

转载 作者:行者123 更新时间:2023-12-02 05:34:23 25 4
gpt4 key购买 nike

我正在大学做一个科学项目,我需要解析元数据文件,在这种情况下它太大了。我的代码是正确的,它适用于小型存档 XML,但我的问题是我需要解析大约 264 GB 的存档。

有什么想法吗?

提前致谢。

最佳答案

对于大型数据集来说,DOM 是一个糟糕的选择,因为它必须加载文档并维护内存中的结构。如果您需要以不同的方式多次处理文档或跨文档执行查询,但不能很好地处理大文件,那么 DOM 是不错的选择

如果您只需要对文档进行一次遍历(并且不需要进行正向或反向搜索),那么您可以使用 SAX Parser

这基本上使用访问者模式来提供有关解析过程的反馈,但仅在内存中保留少量信息。

如果您需要能够向后或向前搜索文档或多次处理文档,您可以考虑将文档拆分为不同的逻辑部分并单独处理这些部分,也许将结果存储在某种数据库中以供使用后期聚合

关于java - 在java中使用DOM解析非常大的XML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25152292/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com