gpt4 book ai didi

java - 像 wget 在客户端使用 Java 那样下载所有图像

转载 作者:太空宇宙 更新时间:2023-11-04 07:25:00 24 4
gpt4 key购买 nike

非常容易download all images from a website using wget .

但是我需要在客户端提供此功能,最好是在 Java 中。

我知道wget的源码可以在线获取,但我不懂C语言,而且源码相当复杂。当然,wget 还有其他一些让我“炸毁源代码”的功能。

由于Java内置了HttpClient,但我不知道wget到底有多复杂,请问在Java中重新实现“递归下载所有图像”功能是否很难?

这到底是如何完成的? wget 是否获取给定 URL 的 HTML 源代码,从 HTML 中提取具有给定文件结尾(.jpg、.png)的所有 URL 并下载它们?它是否还会搜索该 HTML 文档中链接的样式表中的图像?

你会怎么做?您是否会使用正则表达式在 HTML 文档中搜索(相对和绝对)图像 URL 并让 HttpClient 下载每个图像 URL?或者是否已经有一些 Java 库可以做类似的事情?

最佳答案

在 Java 中,您可以使用 Jsoup用于解析任何网页并提取您想要的任何内容的库

关于java - 像 wget 在客户端使用 Java 那样下载所有图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18675256/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com