- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图从一个网站上抓取数据,但我发现我想从中获取一些数据的一段代码在页面的 HTML 中被注释掉了,即它位于这些注释标记内。是否有可能获取这些数据,如果可以,有效的方法是什么。此外,页面中使用了与这些评论中相似的一段文字。下面是一段html代码:
<!--<div class="contact-price clearfix">
<h3>Contact For Price</h3>
<div class="user-online clearfix">
<div class="user-status">
<div class="status-active"></div>
</div>
<a href="#">View Complete Profile</a>
</div>
<div class="user-contact">
<button class="btn-default btn-primary" onclick="checkonline(305654806,event,246)">Chat Now</button>
<p class="call-number">
<i class="icon-phone"></i>
+91 0000000000
<span class="verifi"></span>
</p>
<a href="#" class="message"><i class="icon-messages"></i> Send free SMS</a>
</div>
</div>
-->
<div class="contact-price clearfix">
<h3> </h3>
<div class="user-online clearfix">
<div class="user-status">
<div class="status-active"></div>
laser07
</div>
<a href="com/userProfile?uId=BWYAYgc0U2VTYlJiAWcFaFE1">View Complete Profile</a>
</div>
<div class="user-contact clearfix ">
<button class="btn btn-default" onclick="checkonline(305654806,event,246)">Chat Now</button>
</div>
<div class="user-contact user-details clearfix">
<div class="clearfix phn-email">
<p class="call-number">
<i class="icon-mobile-phones"></i>
XXXXXXXXXX00
<span class="verify"></span>
</p>
<p class="call-number">
<i class="icon-email"></i>
xxxxxxxx@gmail.com
</p>
</div>
<button id ="reCaptchaGetContactDetails" class="btn btn-primary g-recaptcha contact-details " >Contact</button>
</div>
</div>
我想从代码的上半部分抓取数据,即那些评论标签之间的数据。假设我想要 p 标签内的联系电话 0000000。我将如何获得它,因为每次运行我的代码时都会得到一个空指针:
Element elementphone = doc.select("div.contact-price").first().select("div.user-contact").first().select("p.call-number").first();
Phone = elementphone.text();
最佳答案
如果您确定评论中的 html 是有效的,您可以简单地删除它们,然后解析生成的 html:
String html = doc.html();
html = html.replaceAll("<!--", "").replaceAll("-->", "");
doc = Jsoup.parse(html);
关于java - 使用 jsoup 库抓取注释数据 (<!-- -->) 即其中的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49550098/
所以`MKAnnotation's。有趣的东西。 我的问题: 注释的标题和副标题有什么区别?这对注释的视觉组件有何影响? MKPinAnnotationView 和 MKAnnotationView
我正在使用 JBoss 工具将 DB 模式反向工程到 POJO 中。具体来说,我在 hibernatetool ANT 任务中使用了 hbm2java 选项。在 hbm2java 选项下,您可以指定
假设我有这段文字: cat file /* comment */ not a comment /* another comment */ /* delete this * /* multiline
我明白,如果你///在类、字段、方法或属性上方 Visual Studio 将开始为您建立 XML 样式的注释。 但是,我在哪里可以为我的命名空间和/或库添加 XML 注释... 例如: .NET F
int API_VERSION = 21; @TargetApi(API_VERSION)在Android中用于指定该方法/类支持API_VERSION及以下。 我们是否可以镜像类似的东西,指定仅支持
Closed. This question needs to be more focused。它当前不接受答案。
假设我有一个界面如下。 public interface MyInterface{ /** * This method prints hello */ void sayHello();
我已将 Jboss 应用程序迁移到 WebSphere Liberty。我必须删除所有 Jboss 引用库。在这样做的同时,我在某些注释中面临问题。 Jboss 应用程序使用 @SecurityDom
在本教程中,您将了解 JavaScript 注释,为什么要使用它们以及在示例的帮助下如何使用它们。 JavaScript 注释是程序员可以添加的提示,以使代码更易于阅读和理解。JavaScri
我正在建立一个博客,为了发表评论,我有这个 CSS。 #comments { position:absolute; border: 1px solid #900; border-width: 1
我正在尝试在单元格中插入评论。我正在尝试按照代码进行评论,但它没有在创建的 excel 中显示评论。我正在创建 .xls 扩展名。 $objPHPExcel->getActiveSheet()->ge
我正在使用 TS 在 MarionetteJS 上编写项目,我想使用注释来注册路由。例如: @Controller class SomeController { @RouteMapping("so
我有一个应用程序可以在页面上生成大量注释。用户可以单击页面上的任意位置以创建快速注释(例如 Acrobat Pro)可以在一般 中使用一些 javascript 行添加和删除这些注释
是否有 JavaScript 注释? 当然 JavaScript 没有它们,但是是否有额外的库或建议的语言扩展,例如 @type {folder.otherjsmodule.foo} function
Java 中注解的目的是什么?我有一个模糊的想法,认为它们介于注释和实际代码之间。它们在运行时会影响程序吗? 它们的典型用法是什么? 它们是 Java 独有的吗?有 C++ 等价物吗? 最佳答案 注解
其实我们在 Ruby 基础语法 已经比较详细的介绍了 Ruby 语言中的注释 Ruby 解释器会忽略注释语句 注释会对 Ruby 解释器隐藏一行,或者一行的一部分,或者若干行。 Ruby 中的注
我正在 try catch VBA 注释。到目前为止,我有以下内容 '[^";]+\Z 它捕获以单引号开头但在字符串结尾之前不包含任何双引号的任何内容。即它不会匹配双引号字符串中的单引号。 dim s
有没有办法在'svn commit'上将提交注释添加到更改的文件中。有人告诉我有一种方法可以用 cvs 做到这一点,但我们使用 svn。目前,我们使用“$Revision”关键字将修订号添加到更改的文
我正在尝试通过 ManyToMany 注释自动对报告的结果进行排序 @OrderBy : /** * @ORM\ManyToMany(targetEntity="Artist", inversedB
我正在使用 JBoss 5 GA,我创建了一个测试 session bean 和本地接口(interface)。我创建了一个 servlet 客户端。我尝试使用 @EJB 将接口(interface)
我是一名优秀的程序员,十分优秀!