gpt4 book ai didi

java - 使用 Java 在网页上查找链接

转载 作者:行者123 更新时间:2023-12-02 06:24:43 25 4
gpt4 key购买 nike

使用 Java 将网页的源代码存储在一个字符串中。我想提取源代码中的所有url并输出。我对正则表达式之类的东西很糟糕,甚至不知道如何处理这个问题。任何帮助将不胜感激。

最佳答案

Don't use regex .使用parser喜欢JSoup .

String html = "your html string";
Document document = Jsoup.parse(html); // Can also take an URL.
for (Element element : document.getElementsByTag("a")) {
System.out.println(element.attr("href"));
}

关于java - 使用 Java 在网页上查找链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2717760/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com