作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
当我使用InputStreamReader从网页读取数据时一切正常。我在将数据解析为 DocumentHTML 时遇到问题。
主要原因是HTML脚本中有一些特殊字符被错误使用。有两次 & 符号(“&&”),我相信这会导致代码崩溃。
我的代码如下所示:
URL url = new URL(PageUrl);
URLConnection conn = url.openConnection();
// ... omitted ...
// parsing
HTMLDocument doc = (HTMLDocument)db.parse(conn.getInputStream());
由于我正在制作 Android 应用程序,因此我不使用标准解析函数,因为 DocumentHTML 对象会太大。
我发现了很多像使用 jsoup 一样解析 HTML 的现有示例,但它们不是我想要的。
我想编写自己的解析代码,以便 HTMLDocument 对象保持较小。
最佳答案
为什么不使用 Java 中所有可用的 Html 解析器?他们有社区支持,因此是最好的选择。
关于java - 将数据解析为 DocumentHTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13483067/
当我使用InputStreamReader从网页读取数据时一切正常。我在将数据解析为 DocumentHTML 时遇到问题。 主要原因是HTML脚本中有一些特殊字符被错误使用。有两次 & 符号(“&&
我是一名优秀的程序员,十分优秀!