gpt4 book ai didi

java - 从网页程序中获取所有图像 | java

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:39:43 25 4
gpt4 key购买 nike

目前我需要一个给定 URL 的程序,返回网页上所有图像的列表。

即:

标志.png画廊1.jpg测试.gif

在我尝试编写代码之前,是否有可用的开源软件?

语言应该是java。谢谢菲利普

最佳答案

只需使用 simple HTML parser , 比如 jTidy , 然后 get all elements by tag name img然后收集 src List<String> 中每个的属性或者也许 List<URI> .

您可以获得一个InputStreamURL使用 URL#openStream() 然后将其提供给您喜欢使用的任何 HTML 解析器。这是一个启动示例:

InputStream input = new URL("http://www.stackoverflow.com").openStream();
Document document = new Tidy().parseDOM(input, null);
NodeList imgs = document.getElementsByTagName("img");
List<String> srcs = new ArrayList<String>();

for (int i = 0; i < imgs.getLength(); i++) {
srcs.add(imgs.item(i).getAttributes().getNamedItem("src").getNodeValue());
}

for (String src: srcs) {
System.out.println(src);
}

但是我必须承认,Bozho 建议的 HtmlUnit 确实看起来更好。

关于java - 从网页程序中获取所有图像 | java ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2172733/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com