gpt4 book ai didi

java - 使用 jsoup 库抓取注释数据 (<!-- -->) 即其中的数据

转载 作者:行者123 更新时间:2023-11-30 10:17:52 29 4
gpt4 key购买 nike

我试图从一个网站上抓取数据,但我发现我想从中获取一些数据的一段代码在页面的 HTML 中被注释掉了,即它位于这些注释标记内。是否有可能获取这些数据,如果可以,有效的方法是什么。此外,页面中使用了与这些评论中相似的一段文字。下面是一段html代码:

    <!--<div class="contact-price clearfix">
<h3>Contact For Price</h3>
<div class="user-online clearfix">
<div class="user-status">
<div class="status-active"></div>

</div>
<a href="#">View Complete Profile</a>
</div>

<div class="user-contact">
<button class="btn-default btn-primary" onclick="checkonline(305654806,event,246)">Chat Now</button>
<p class="call-number">
<i class="icon-phone"></i>
+91 0000000000
<span class="verifi"></span>
</p>
<a href="#" class="message"><i class="icon-messages"></i> Send free SMS</a>
</div>
</div>
-->


<div class="contact-price clearfix">
<h3> </h3>
<div class="user-online clearfix">
<div class="user-status">
<div class="status-active"></div>
laser07
</div>
<a href="com/userProfile?uId=BWYAYgc0U2VTYlJiAWcFaFE1">View Complete Profile</a>
</div>
<div class="user-contact clearfix ">
<button class="btn btn-default" onclick="checkonline(305654806,event,246)">Chat Now</button>
</div>
<div class="user-contact user-details clearfix">
<div class="clearfix phn-email">
<p class="call-number">
<i class="icon-mobile-phones"></i>
XXXXXXXXXX00
<span class="verify"></span>
</p>
<p class="call-number">
<i class="icon-email"></i>
xxxxxxxx@gmail.com
</p>
</div>
<button id ="reCaptchaGetContactDetails" class="btn btn-primary g-recaptcha contact-details " >Contact</button>
</div>
</div>

我想从代码的上半部分抓取数据,即那些评论标签之间的数据。假设我想要 p 标签内的联系电话 0000000。我将如何获得它,因为每次运行我的代码时都会得到一个空指针:

Element elementphone = doc.select("div.contact-price").first().select("div.user-contact").first().select("p.call-number").first();

Phone = elementphone.text();

最佳答案

如果您确定评论中的 html 是有效的,您可以简单地删除它们,然后解析生成的 html:

String html = doc.html(); 
html = html.replaceAll("<!--", "").replaceAll("-->", "");
doc = Jsoup.parse(html);

关于java - 使用 jsoup 库抓取注释数据 (&lt;!-- -->) 即其中的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49550098/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com