gpt4 book ai didi

java - 将数据解析为 DocumentHTML

转载 作者:行者123 更新时间:2023-12-01 05:00:14 25 4
gpt4 key购买 nike

当我使用InputStreamReader从网页读取数据时一切正常。我在将数据解析为 DocumentHTML 时遇到问题。

主要原因是HTML脚本中有一些特殊字符被错误使用。有两次 & 符号(“&&”),我相信这会导致代码崩溃。

我的代码如下所示:

URL url = new URL(PageUrl);
URLConnection conn = url.openConnection();
// ... omitted ...

// parsing
HTMLDocument doc = (HTMLDocument)db.parse(conn.getInputStream());

由于我正在制作 Android 应用程序,因此我不使用标准解析函数,因为 DocumentHTML 对象会太大。

我发现了很多像使用 jsoup 一样解析 HTML 的现有示例,但它们不是我想要的。

我想编写自己的解析代码,以便 HTMLDocument 对象保持较小。

最佳答案

为什么不使用 Java 中所有可用的 Html 解析器?他们有社区支持,因此是最好的选择。

Open Source HTML Parsers in Java

关于java - 将数据解析为 DocumentHTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13483067/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com