gpt4 book ai didi

java - Jsoup 选择没有主题标签的链接

转载 作者:行者123 更新时间:2023-12-01 18:53:20 24 4
gpt4 key购买 nike

我正在使用 JSOUP 从 html 正文中过滤链接。

我使用这些选择器:

Elements links = doc.select("a[href]"); // Select all links
links.select("a[href*=#]").remove(); // remove links containing #

但是仍然有包含主题标签的链接。这怎么可能?

最佳答案

Elements 上的 remove() 方法不会从 Elements 本身删除匹配项,而是从关联的 Document 对象中删除匹配项。

例如,如果您有:

<html>
<body>
<a href="#someid"></a>
<a href="http://www.google.pt"></a>
</body>
</html>

links.select("a[href*=#]").remove(); 之后,您将拥有:

<html>
<head></head>
<body>
<a href="http://www.google.pt"></a>
</body>
</html>

如果您想选择所有非主题标签链接,您可以执行以下操作:

Elements links = doc.select("a[href~=[^#]*");

关于java - Jsoup 选择没有主题标签的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15076236/

24 4 0