gpt4 book ai didi

java - 使用 Jsoup 解析 HTML 时间表

转载 作者:太空宇宙 更新时间:2023-11-04 14:34:16 27 4
gpt4 key购买 nike

我知道有很多关于解析 HTML 表格的问题。然而,在做了一些研究并查看了 Jsoup 之后,我有点被它难倒了。

我有一个时间表

enter image description here

我想解析取出<td>的文本标签,但以某种格式保存。

通过简单地使用 Jsoup 来尝试可用的函数并查看 Cookbook 和当前的 API 文档。由此我设法做到了以下几点;

Document doc = Jsoup.connect("http://crwnmis3.staffs.ac.uk/Reporting/Individual;Student%20Sets;name;L2SE?&template=Online%20One%20Page%20Student%20Set&days=1-5&periods=5-53&width=0&height=0").get();

String title = doc.select("td").text();
System.out.println(title);

唯一的问题是这会打印出一个长字符串。

我更愿意将数据分成易于管理的 block 。也许我可以做一个title.Split(); ?
然而,这意味着没有演讲是有时间的。除非没有计算空白和计算时间的方法,否则假设每个空白为 15 分钟。

最佳答案

我将从每次处理一行开始。所以我会从每个工作日之后的刻钟开始,使用像

这样的选择器
tr td.row-label-one:contains(Tue) ~ td

如果循环数组的内容,例如 ["Mon","Tue",..."Fri"],您可以处理整个星期。

此 css 查询将为您提供那个工作日的 td 元素 sibling 。那些 sibling 是那个工作日的刻钟。

所以只需使用上午 9 点作为基础并计数,直到找到一个非空元素像“COSE50582/Lec/Sem2 面向对象应用工程 Gillibrand D, Mansfield GD D116”

你可以在索引 4 处找到这个元素,所以 9 + (15 min * 4 ) = 10 am

注意:为简单起见,我假设所有科目的持续时间只有 4 个季度,否则您可以使用 colspan 来计算科目的持续时间。

关于java - 使用 Jsoup 解析 HTML 时间表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29568168/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com