- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
是否可以像下面这样从这个网站上找到评论级别? https://www.ozbargain.com.au/node/249439#comment-3719026
我可以从 jsoup 解析评论、用户名等,但我无法获得正确的评论级别。
查看该页面的源代码,与正确的实时帖子不匹配,除非我读错了。
有办法解决吗?
我能够使用以下方法生成源评论级别:
String url = "https://www.ozbargain.com.au/node/249439";
Document doc = Jsoup.connect(url).get();
Elements level = doc.select("ul.comment");
for(Element column : e.select("ul")){
//comment level
System.out.println(column.attr("class"));
levels.add(column.attr("class"));
}
但它看起来不对。仅显示 0 级评论中的 1 条等。
谢谢
最佳答案
for(Element column : e.select("ul")) {
//comment level
System.out.println(column.attr("class"));
levels.add(column.attr("class"));
}
上面代码中的e
是从哪里来的?
无论如何,您需要解析类属性值才能找到评论级别。
这是一个有效的示例代码:
public static void main(String[] args) throws IOException {
String url="https://www.ozbargain.com.au/node/249439#comment-3719026";
Document doc = Jsoup.connect(url).get();
Elements comments = doc.select("div.comment-wrap");
Matcher levelMatcher = Pattern.compile("(?i)^(.*level)(\\d+)(.*)$").matcher("");
List<String> levels = new ArrayList<>();
System.out.println("Comments found: "+ comments.size());
for (Element comment : comments) {
if (levelMatcher.reset(comment.parent().parent().className()).find()) {
levels.add(levelMatcher.replaceAll("$2"));
}
}
System.out.println(levels);
}
Comments found: 38
[0, 1, 2, 3, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 2, 3, 3, 1, 2, 3, 3, 0, 1, 2, 3, 2, 3, 3, 2, 0, 0, 0, 1, 2, 3]
Comments found: 14
[0, 1, 0, 1, 0, 1, 1, 2, 1, 0, 0, 1, 2, 0]
关于java - 从论坛帖子中解析评论级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37413397/
我目前正在使用 php 和 sql 创建一个论坛。我的问题是如何将主题按正确的顺序排列,假设每页总共有 200 和 15 个主题,而我在第 10 页上。 我无法选择每个 ID,因为如果有人将时间戳发布
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想要改善这个问题吗?更新问题,以便将其作为on-topi
基本上,我正在为 Intranet 编写一个小型论坛脚本。 我有 3 个用于论坛的 mysql (MySQLi) 表: forum_answer - 保存回复forum_quest - 持有第一个帖子
我正在尝试实现 django-registration-redux 并使用了由 Andres 编写的模板,网址为 https://github.com/macdhuibh/django-registr
我正在开发一个讨论论坛网站。当您打开论坛时,网络服务会获取所有活跃的帖子。 标题、评论数、近期事件(最新评论的日期)、发布者、状态。 除最近的事件外,我能够获取上述所有数据。 SELECT `po
我有一个使用 phpBB 的论坛。现在我想从源代码做这样的事情: 登录(“用户”,“密码”) 如何在 phpBB 中执行此操作? 最佳答案 首先你需要为 phpBB 引导: define('IN_PH
我想知道检测人们在我的论坛上提交帖子时使用的字母表的最佳方法(对博客也很有用)。事情是最近我收到了很多西里尔字母、希腊字母和日语的垃圾邮件,所以由于我的论坛是为讲法语和英语的人准备的,所以我想防止垃圾
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
所以我几年前创建了这个 vBulletin 论坛,几个月前它开始时不时地通过电子邮件向我发送错误消息。由于我在创建网站时注册为论坛管理员,现在当出现错误时它会向我发送电子邮件。网站所有者和我聚在一起,
我很难在不同的 php 论坛之间进行选择。我正在寻找一个轻量级、安全且易于定制的论坛。 谷歌搜索给我提供了几十个由个人制作的“简单的 php 论坛”,但我正在寻找一个基于社区的论坛。因为,你知道,帮助
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 12 年前。 Improve thi
我一直在寻找新的论坛软件(线程)或公告板(平面/分区)。我想知道是否有基于大型 PHP 框架之一的实现(CodeIgniter、Kohana、Yii、CakePHP、ZF、Seagull、Fusebo
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我知道这个问题已经在这里问过几次了,但没有一个答案让我满意。这是因为几乎所有这些都涉及与数据库相关的巨大读/写过程,我想不惜一切代价避免。 关于未读的讨论/主题/帖子,有很多事情要考虑。不知道MyBB
我被指派在我们已经使用了一段时间的内部 CMS 中添加一个论坛。该系统有自己的登录/用户系统和已建立的用户数据库。理想情况下,我会寻找最简单的论坛软件来转换为与我们的系统一起使用,但如果有必要,可以重
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我的表单有一个不寻常的问题(这里是精简版): (function($){ $("form").submit(function(){ alert('Ch
作为我论文论文的一部分,我构建了一个“机器人”,它会抓取 C 语言编程类(class)的官方论坛并搜索常见问题以便发布回复。我现在必须模拟登录才能发布适当的回复。登录表单如下: !-- 登录表单 --
我正在尝试创建一个在后台运行的小脚本,并检查论坛上是否有新消息(使用 phpBB3)。由于许多子论坛需要登录用户的权限才能查看,因此我创建了一个脚本,该脚本会向服务器发送后请求以先登录。 该脚本目前已
我是一名优秀的程序员,十分优秀!