gpt4 book ai didi

jsoup - 用 Jsoup 解析一个巨大的 HTML 流

转载 作者:行者123 更新时间:2023-12-03 17:55:03 27 4
gpt4 key购买 nike

任何人都可以提供有关我将如何解析超大 HTML 流/文件的指针或建议。例如,我有一个大约有 270,000 行的表,我想一次将它带入我的应用程序大约 20,000 行。 jsoup 解析方法允许使用 HTML 片段,但我不清楚读取表示此片段的 XXX 字节的最有效和最干净的方法是什么。

任何帮助最受赞赏。

最佳答案

如果它是 XHTML,并且您不需要一次将整个内容保存在内存中,那么更好的选择可能是使用 SAX 解析器并使用开始和结束标记事件挑选出您需要的数据。

另一个想法可能是 StAX 解析器。

关于jsoup - 用 Jsoup 解析一个巨大的 HTML 流,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12610242/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com