- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 Jsoup 解析器从某个表中获取数据。
表格的HTML代码:
<table class="ednevnik-seznam_ur_teden">
<tr>
<th width="10%">
<div style="color:black;">Ura</div>
<div style="font-size:11px;"> </div></th>
<th class="ednevnik-seznam_ur_teden-th-danes">
<div>Ponedeljek</div>
<div style="font-size:10px;font-weight:normal;color:#777;">16. 12.</div>
</th>
<th >
<div>Torek</div>
<div style="font-size:10px;font-weight:normal;color:#777;">17. 12.</div>
</th>
<th >
<div>Sreda</div>
<div style="font-size:10px;font-weight:normal;color:#777;">18. 12.</div>
</th>
<th >
<div>Četrtek</div>
<div style="font-size:10px;font-weight:normal;color:#777;">19. 12.</div>
</th>
<th >
<div>Petek</div>
<div style="font-size:10px;font-weight:normal;color:#777;">20. 12.</div>
</th>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">1. ura</div>
<div class="text10 gray">7:00 - 7:45</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-1-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-1-2013-12-17" class="ednevnik-seznam_ur_teden-td ">
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-1-2013-12-18" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Matematika">MAT</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
M. Baloh, 108 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-1-2013-12-19" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Izdelava osnovnih vezij praksa">IOVP</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
R. Fele, ED5 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-1-2013-12-20" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Slovenščina">SLO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Gutman, 107 </div>
</div>
</td>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">2. ura</div>
<div class="text10 gray">7:50 - 8:35</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-2-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
<div class="ednevnik-seznam_ur_teden-urnik ednevnik-seznam_ur_teden-td-danes" style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Geografija">GEO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Bec, 109 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-2-2013-12-17" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Angleščina">ANG</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
I. Lesjak, 106 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-2-2013-12-18" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Slovenščina">SLO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Gutman, 107 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-2-2013-12-19" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Izdelava osnovnih vezij praksa">IOVP</span> </td>
<td style="border:none;" align="right"><a href="javascript:;" onclick="$('#ednevnik-seznam_ur_teden-blok-2-2013-12-19').toggle();stop_propagation(event);" class="ednevnik-seznam_ur_teden-vec_ur" title="Več skupin">2</a></td>
</tr>
</table>
<div class="text11">
R. Fele, ED5 </div>
</div>
<div id="ednevnik-seznam_ur_teden-blok-2-2013-12-19" class="ni_prvi"><div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;border-top:1px solid #E6E6E6;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Infor.s tehniškim kom. vaje">ITKV</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Kirn, 207 </div>
</div>
</div> </td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-2-2013-12-20" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Matematika">MAT</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
M. Baloh, 108 </div>
</div>
</td>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">3. ura</div>
<div class="text10 gray">8:40 - 9:25</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-3-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
<div class="ednevnik-seznam_ur_teden-urnik ednevnik-seznam_ur_teden-td-danes" style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Slovenščina">SLO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Gutman, 107 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-3-2013-12-17" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Kemija">KEM</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Kovač Hace, 204 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-3-2013-12-18" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Angleščina">ANG</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
I. Lesjak, 106 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-3-2013-12-19" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Izdelava osnovnih vezij praksa">IOVP</span> </td>
<td style="border:none;" align="right"><a href="javascript:;" onclick="$('#ednevnik-seznam_ur_teden-blok-3-2013-12-19').toggle();stop_propagation(event);" class="ednevnik-seznam_ur_teden-vec_ur" title="Več skupin">2</a></td>
</tr>
</table>
<div class="text11">
R. Fele, ED5 </div>
</div>
<div id="ednevnik-seznam_ur_teden-blok-3-2013-12-19" class="ni_prvi"><div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;border-top:1px solid #E6E6E6;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Infor.s tehniškim kom. vaje">ITKV</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Kirn, 207 </div>
</div>
</div> </td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-3-2013-12-20" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Izdelava osnovnih vezij">IOV</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
J. Kalšek, 112 </div>
</div>
</td>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">4. ura</div>
<div class="text10 gray">9:30 - 10:40</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-4-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
<div class="ednevnik-seznam_ur_teden-urnik ednevnik-seznam_ur_teden-td-danes" style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Zgodovina">ZGO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
V. Kralj, 109 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-4-2013-12-17" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Umetnost">UME</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Bec, 109 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-4-2013-12-18" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Geografija">GEO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Bec, 109 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-4-2013-12-19" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Angleščina">ANG</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
I. Lesjak, 106 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-4-2013-12-20" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Informatika s tehniškim komuniciranjem">ITK</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
I. Pavlič, 207 </div>
</div>
</td>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">5. ura</div>
<div class="text10 gray">10:45 - 11:30</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-5-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
<div class="ednevnik-seznam_ur_teden-urnik ednevnik-seznam_ur_teden-td-danes" style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Matematika">MAT</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
M. Baloh, 108 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-5-2013-12-17" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Slovenščina">SLO</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Gutman, 107 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-5-2013-12-18" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Upravljanje s programirljivimi napravami">UPN</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
R. Fele, 216 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-5-2013-12-19" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Kemija">KEM</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
S. Kovač Hace, 204 </div>
</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-5-2013-12-20" class="ednevnik-seznam_ur_teden-td ">
<div class="ednevnik-seznam_ur_teden-urnik " style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Informatika s tehniškim komuniciranjem">ITK</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
I. Pavlič, 207 </div>
</div>
</td>
</tr>
<tr>
<td width="10%" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-ura">
<div class="black bold text14" style="padding-bottom:0px;">6. ura</div>
<div class="text10 gray">11:35 - 12:20</div>
</td>
<td width="18%" id="ednevnik-seznam_ur_teden-td-6-2013-12-16" class="ednevnik-seznam_ur_teden-td ednevnik-seznam_ur_teden-td-danes">
<div class="ednevnik-seznam_ur_teden-urnik ednevnik-seznam_ur_teden-td-danes" style="color:#444;"> <table class="w100 collapse">
<tr>
<td style="border:none;" class="text14 bold"><span title="Izdelava osnovnih vezij">IOV</span> </td>
<td style="border:none;" align="right"></td>
</tr>
</table>
<div class="text11">
J. Kalšek, 216 </div>
//code goes on here
抱歉,代码比较乱,您可以尝试自己查看页面源代码:https://www.easistent.com/urniki/cc45c5d0d303f954588402a186f5cdba5edb51d6/razredi/16515
但有人已经告诉我,它在某些国家/地区无法打开该页面。
因此,如果每个 td 或至少 tr 都有自己唯一的 ID 或 CLASS,那么这就不成问题了。但它们都是相同的,每个 td 内部都有另一个 td ,其类别为“text 14粗体”,并且在该 td 内,有一个span 具有特定的标题。但这个标题对我没有帮助,因为如果这个表被更新,代码将毫无用处,因为标题也会改变。
或者我可能以错误的方式处理这个问题,并且有一个更好的库可以更轻松地解析 html?
我真的不擅长解释,我无法向任何搜索引擎解释这一点,所以如果有人提供帮助,我将非常感激。
最佳答案
查看源代码,保存时间表的感兴趣的表如下:
<table class="ednevnik-seznam_ur_teden">
每一行都由表主体内的 tr
元素表示。A- 因此可以使用 css 选择器和语法来选择行
Elements e = doc.select("table.ednevnik-seznam_ur_teden tbody tr span");
它只是告诉 Jsoup 选择类 的表的
。有点嵌套,但很容易理解。tbody
内的 tr
元素内的所有 span
元素ednevnik-seznam_ur_teden
所选节点的 text
属性的输出将是 span
元素内的所有文本。
要分隔 tr
元素,只需在选择元素时使用 tr:eq(n)
语法即可。 tr:eq(n)
告诉选择器仅选择索引等于 n
的 tr
。例如,要按照您在评论中建议的方式选择第二行的值,可以使用以下方法:
Elements e = doc.select("table.ednevnik-seznam_ur_teden tbody tr:eq(2) span");
for (Element element : e) {
System.out.println(element.text());
}
将输出
GEO
ANG
SLO
IOVP
ITKV
MAT
关于java - 区分表格元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20612794/
不确定是否可能,但只是想知道 CSS 中是否有一种方法来区分两种浏览器,即 IE6 和 IE8,因为我有一个我需要应用的样式,但 IE6 和 IE8 的值需要不同,即 ul.sf-menu li li
我正在为 C 库编写 C++ 抽象。 C 库有几个用于标识远程资源的 ID 的类型定义: typedef int color_id; typedef int smell_id; typedef int
有谁知道当以编程方式遍历 Word 文档时,您可以判断一个段落是否构成目录的一部分(或者实际上,构成字段一部分的任何其他内容)。 我提出这个问题的原因是我有一个 VB 程序,它应该从文档中提取前几段实
假设我的数据集包含三列:id(标识)、case(字符)和 value(数字)。这是我的数据集: tdata <- data.frame(id=c(1,1,1,1,2,2,2,2,3,3,3,3,4,4
我在解释 gcc (4.8.2) 警告和错误时遇到问题。更准确地说,很难分辨一个问题在哪里结束,另一个问题从哪里开始。我只能通过控制台访问构建机器,因此不能选择使用 IDE。 我真的需要能够快速区分个
我想创建一个泛型类型,它只从类定义中选择修饰的方法。 function test(ctor: any, methodName: any) {} class A { @test publ
是否有规范的 base-R 方法来确定函数参数是否是对象名称而不是文字/表达式? 虽然通常不鼓励使用 NSE,但偶尔会有人有一个好主意并想使用它。 data.frame 是我认为“方便”的最简单用例:
我已经实现了 didSelectRowAtIndexPath 和accessoryButtonTappedForRowWithIndexPath 似乎永远不会触发。但是,didSelectRowAtI
我需要确定数据框中的哪些列是小数,哪些是字符串。 使用 df.dtypes 为两种列类型提供“对象”: import pandas as pd import decimal data = {'dec1
有没有办法在 Vim 中区分隐藏缓冲区和事件缓冲区? 我需要确定窗口中的缓冲区是否处于事件状态,以便可以切换它。 尝试了 bufloaded、bufexists 和 buflisted,但它们对于事件
在 JavaScript 中区分事件的最佳方法是什么。 实际上有两点我感兴趣。第一点是事件中是否有类似 id 的东西(这对于调试目的非常有用)。另一点是有更好的方法来区分 mousedown 和 mo
我有一个 php 页面,里面有多个表单。 "> "> " value=""> " value=""> 这些表单是通过循环遍历 MySQL 上的所有数据而生成的。每个表单和输入都
Pony 有一个未参数化的异常值。 不幸的是,我经常有一些代码想要抛出不同类型的异常,并且我需要知道它们是什么,以便正确处理它们——例如,简单地说,当停止程序时,向用户提供以下信息很重要正确的错误消息
出于对所有神圣事物的热爱,您如何区分预定义的 .NET 异常类中的不同“异常风格”? 例如,一段代码可能会抛出 XmlException在以下条件下: 文档的根元素为NULL 文档中的字符无效 文档太
正如您在下面看到的,我创建了一个 JComboBox,其中“选项”数组中的元素作为列表中的选项。 当选择列表中的特定项目时,我想显示 JLabels“一个”或“两个”。例如。选择选项一显示“一”,选择
我有一个表,其中包含四列用户名、产品名称、产品价格和一个名为 item_paid 的 boolean 列。相同的产品名称可以作为重复条目插入到表中。但是有没有办法区分一行和重复行?或者我应该创建一个名
是否可以使用反射来区分仅 getter 属性和表达式主体属性? class MyClass { DateTime GetterOnly { get; } DateTime Expres
我即将为一个学校项目制作一个小程序,该程序应该能够识别通过 MIDI 钢琴输入演奏的和弦(这只是其中的一部分)。 目前为止,每次按下和每次释放 MIDI 键盘上的某个键,我都会得到一个 ShortMe
我正在使用“自动”反序列化器从 Kafka 消费 Avro 序列化消息,例如: props.put( ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFI
我需要从两个表中检索数据。第一个是事件列表,第二个是 field 列表。 我在两个表中都有一个同名的字段:events.venue(这是一个 ID),venues.venue 是地点的名称,比如“bl
我是一名优秀的程序员,十分优秀!