gpt4 book ai didi

java - 使用 Jsoup 获取具体 URL

转载 作者:行者123 更新时间:2023-12-01 18:01:40 24 4
gpt4 key购买 nike

我正在尝试弄清楚如何将无用信息与 jsoup 的链接分开。我应该在这里解析一堆代码:

view-source:https://vk.com/search?c%5Bq%5D=%D0%BA%D0%BE%D1%82&c%5Bsection%5D=communities

public class TestSoup {
public static void main (String[] args) throws Exception {
Document doc = Jsoup.connect("https://vk.com/smcat").get();
Elements links;
//links = doc.select("div > a > img ");
links = doc.select("[data-src_big]");

System.out.println(links);
}
}

我现在的输出:

<img src="https://pp.vk.me/c636126/v636126727/35e1b/ludjlj7T4i8.jpg" class="ph_img" data-id="-23530818_436648332" data-src_big="https://pp.vk.me/c636126/v636126727/35e1c/a1IyGrtjzUQ.jpg|600|448">

有人可以解释一下如何从输出中提取第二个链接吗?非常感谢。

最佳答案

data-src_big属性,每个元素都可以有自己的值。

要迭代链接元素,您可以使用

for (Element el : links){
..
}

要从元素中获取指定属性的值,您可以使用

el.attr("attrribute_name")

如果属性的值是写为相对路径的URL地址,如./foo/bar.jpg,但你想将其获取为绝对路径,如http://server.com/foo/bar.jpg 你可以使用

el.absUrl("attribute_name")

关于java - 使用 Jsoup 获取具体 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40453272/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com