gpt4 book ai didi

java - 是否可以只下载页面的 HEAD 标签?

转载 作者:可可西里 更新时间:2023-11-01 16:11:06 25 4
gpt4 key购买 nike

我对此做了一些研究,但没有得出结论性的答案。

这个问题奠定了它的一些路径:How can I download only part of a page?

但话又说回来,我不想只下载页面的随机部分,而是第一个标签之一,即头部。

是否有可能以某种方式查询页面,并将其内容流式传输到缓冲区并在您找到更接近 </head> 的标签后立即停止下载(丢弃其余部分) ?

编辑:向页面本身添加内容是不可能的,因为我想在我的应用程序上提取网站标题。

想象 http://stackoverflow.com作为参数输入。整个页面大约 240kb,但如果我在点击 </head> 时停止下载,它只有 5kb。允许我为此页面节省大约 97% 的带宽。

最佳答案

也许这对你来说就足够了——打开一个 URLConnection 并从输入流中读取



public class test {
public static void main(String[] args) throws Exception {

URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));

String inputLine;
while ((inputLine = in.readLine()) != null){
if(inputLine.contains("</head>")) break;
System.out.println(inputLine);
}
in.close();
}

}

here你有教程

关于java - 是否可以只下载页面的 HEAD 标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33424698/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com