gpt4 book ai didi

java - 解析 html(可能格式不正确),无需在 Java 中下载整个文件

转载 作者:行者123 更新时间:2023-12-01 14:09:19 25 4
gpt4 key购买 nike

我正在寻找一种从InputStream读取和解析部分html文件的方法。假设输入是这样的:

<html>
<head>
<meta something="something">

理想的解决方案是在看到该标签后,将其存储在某处并关闭连接。在这种情况下,HTML 的格式可能不正确(因为我们只得到了它的一部分),因此 xml 解析器可能会失败。有办法做到这一点吗?

最佳答案

您可以使用JSoup

String partialHtml = "<html><head><meta something=\"something\">";
Document document = Jsoup.parse(partialHtml);
Elements values = document.getElementsByAttribute("something");
for (Element el : values) {
System.out.println(el.attr("something"));
}

关于java - 解析 html(可能格式不正确),无需在 Java 中下载整个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18664504/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com