gpt4 book ai didi

java - 解析特定类之前的某个标签的数据

转载 作者:行者123 更新时间:2023-11-30 02:11:21 25 4
gpt4 key购买 nike

我需要通过标签(“p”)解析网页中的数据。我尝试这样:

Elements content = document.getElementsByTag("p");
for(Element el : content) {
System.out.println(el.text());

}

而且工作正常。但我得到了多余的数据。例如:

<div class="DicCellTerm">
<h1>Impossible</h1>
<div class=des>
<p class=par2><span class=hint><em>smth</em></span></p>
<p class=par2>1) (<em>with</em>) all, do</p>
<p class=par2>2) <span class=hint><em>text</em></span> some words</p>
<p class=par3>it is impossible</p>
</div>
</div>
</div><!--DicCell end-->
<div align="center" class="AdContent" id="adcontentnoprint">
<div class=SharedItems>
<div class=DicCellParent>
<span class=LinkOtherDic>+ dictionary <strong>impossible</strong> - translate</span>
<div class=DicCellOther id=diccellothershow>
<h2><a href='/aljl-ktatlr/liotry-rssian-caar-csr-tdm-799.htm' title="impossible | impossible translate | dictionary">impossible</a></h2>
<div class=des>
<p class=par1>1) important, is</p>
<p class=par1>what</p>
<p class=par1>2) true, false</p>
</div>
</div>
<!--DicCellOther end-->
</div>
<!--DicCellParent end-->
<div class=DicCellParent>
<span class=LinkOtherDic>+ translate <strong>important</strong> - dictionary</span>
<div class=DicCellOther id=diccellothershow>
<h2><a href='/all-cvdr/dicghnary-rhhan-chtar-ht-hm-800.htm' title="translate">importnant</a></h2>
<div class=des>
<p class=par1>1) müim, emiyetli; emiyet bar</p>
<p class=par1>it is very important - bu pek müimdir, bunıñ büyük emiyeti bar</p>
<p class=par1>2) qopayıp, qabarıp</p>
</div>
</div>
<!--DicCellOther end-->
</div>
<!--DicCellParent end-->
</div>
<!--SharedItems end-->

我需要在类 SharedItems 之前通过标签“p”获取数据。我尝试按“DicCellTerm”类解析数据,并获得正确的数据。所有数据都写在一行中,但我需要像在网页上一样获取数据。

最佳答案

Elements elements = document.select(".DicCellTerm p");

这会获取 .DicCellTerm 类中的所有 p,然后您可以迭代元素。
这里是 jsoup 中所有可能的选择器的链接,这是我获得大部分帮助的地方 =)
https://jsoup.org/apidocs/index.html?org/jsoup/select/Selector.html

关于java - 解析特定类之前的某个标签的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49982986/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com