gpt4 book ai didi

html - 使用 Jsoup HTML Parser 解析注释标签

转载 作者:行者123 更新时间:2023-11-27 23:32:24 26 4
gpt4 key购买 nike

我正在使用基本的解析器程序解析一个简单的 HTML 文档。

Document doc = Jsoup.parse(responseFromServer);

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
String linkText = null;
for (Element link : links) {
linkText = link.text();
}

一些标签被注释掉了。我还想解析评论中的那些标签。由于我无权访问 HTML 输出源,因此我无法编辑文件和删除评论。

如何解析评论标签?

最佳答案

Jsoup 默认忽略注释。要解析它们,您可以在解析之前转换 html 字符串。沿线的东西

 htmlStr = htmlStr.replaceAll("<!--|-->","");
document doc = Jsoup.parser(htmlStr);

只有当被注释掉的 html 确实或多或少是有效的 HTML 时,这才会毫无问题地工作。如果它只是文本,您可能需要进行不同的转换。

关于html - 使用 Jsoup HTML Parser 解析注释标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35208563/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com