gpt4 book ai didi

java - 如何使用 Jsoup 选择器 "not"

转载 作者:可可西里 更新时间:2023-11-01 13:29:03 26 4
gpt4 key购买 nike

<div id='contents'>
<div class="article_view">
<div class="article_txt">
<strong>I don't want to get this point
<br>I don't want to get this point
<br>I don't want to get this point
</strong>

<div class='articlePhotoC'>
<img src="" width='500'>
<span class='t' style='width:480px;'>
<b>I don't want to get this point </b>
I don't want to get this point<br>
</span>
<div id='adBox' class='txt_ad' style='width:500px;'></div>
</div>
From here I want to get--------------
<br><br>
<div class='sub_cont_AD08'></div>
</div>
</div>

我不知道如何在 Java 中使用 notSelector。我试着这样做:

  Elements cont = doc.select("div.article_view :not(div.article_view)"); 

但它不起作用。结果包括所有“我不想得到这一点”。我希望得到的只是“我想从这里得到~~~~”。

谢谢!

最佳答案

如果您也不需要文本“From here I want to get----------------”,即您只想选择 <div class="article_view"> 中的元素但不是 <div class="article_txt">及其子项,您可以这样做:

Elements els = doc.select("div.article_view>*:not(.article_txt)");

这将选择所有元素 ( * ),它们是类为“article_view”的 div 的直接子元素 (>),类为“article_txt”的元素除外。

编辑

现在,它已经被定义,你想要的元素确实是 div.article_txt 的子元素。元素,我需要修改我的答案:

Elements els = doc.select("div.article_view>div.article_txt>*:not(strong,div.articlePhotoC)");

这变得很麻烦,因为您现在需要定义一个不应包含的内容列表。注意 strong 之间的逗号和 div.articlePhotoC在 CSS 中充当 AND 运算符

关于java - 如何使用 Jsoup 选择器 "not",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32964533/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com