gpt4 book ai didi

java - 使用 Jsoup.connect() 时会发生什么?为什么这么慢?

转载 作者:行者123 更新时间:2023-12-01 21:59:16 25 4
gpt4 key购买 nike

我使用以下行来加载文档

Document doc = Jsoup.connect("http://www.some.site.with.lotsof.images/")
.header("Accept-Encoding", "gzip, deflate")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0")
.maxBodySize(0)
.timeout(600000).get(); // So Slow (~10 Seconds)
Elements lyricList = doc.getElementsByClass("some-class");

我只需要图像的src。所以我只需要加载纯 html 文本。

由于从 URL 加载图像,线路速度是否较慢?

我的意思是 Jsoup.connect() 是否等待整个页面与图像一起加载?

最佳答案

不要使用 Jsoup 进行获取和解析,而是尝试结合使用 OkHttp 进行获取和 Jsoup 进行解析

OkHttpClient okHttp = new OkHttpClient();
Request request = new Request.Builder().url("https://example.com").get().build();
Document doc = Jsoup.parse(okHttp.newCall(request).execute().body().string());

这对我的情况产生了很大的影响,以下是我运行的简单基准测试的平均结果:

okHttp+Jsoup: 283ms

Jsoup: 476ms

关于java - 使用 Jsoup.connect() 时会发生什么?为什么这么慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33863683/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com