gpt4 book ai didi

javascript - 抓取没有 ID 或类的 HTML 表格文本 - JavaScript 或 jQuery

转载 作者:行者123 更新时间:2023-12-03 01:37:56 24 4
gpt4 key购买 nike

我在尝试从网站 HTML 表中抓取一些数据时遇到一些困难。我想要检索的标签没有 ID 或类,所以如果你们能帮我解决这个问题,我会很受伤:

这就是表格的外观(为了不占用本文的太多空间,代码被删除):

<table class="table table-striped table-large1">
<thead>
<tr class="small">
<th>No</th>
<th>Date/Time</th>
<th colspan="7">Indexed pages /<br>
Processed / Skipped / Fetched /<br>
Change (Added / Removed)</th>
<th>Proc.time</th>
<th>Bandwidth</th>
<th>Broken links</th>
<th>Images</th>
<th>Videos</th>
<th>RSS</th>
<th>News</th>
</tr>
</thead>
<tbody><tr class="block1">
<td>1</td>
<td><a href="site/3845806/chlog/?log=8950501" title="View details">2018-06-20 01:13</a></td>
<td>944</td>
<td>969</td>

<td><i><strike>25</strike></i></td>
<td>920</td>

<td><i style="color:#900">↓-2</i></td>
<td><i>-</i></td>
<td><i>-2</i></td>

<td>0:12:44s</td>
<td>28.82M</td>
<td>3</td>
<td>580</td>
<td>4</td>
<td>8</td>
<td>0</td>
</tr>
<tr class="block1">
<td>2</td>
<td><a href="site/3845806/chlog/?log=8934464" title="View details">2018-06-17 01:14</a></td>
<td>946</td>
<td>968</td>

<td><i><strike>22</strike></i></td>
<td>919</td>

<td></td>
<td><i>+2</i></td>
<td><i>-2</i></td>

<td>0:14:05s</td>
<td>28.89M</td>
<td>0</td>
<td>580</td>
<td>4</td>
<td>8</td>
<td>0</td>
</tr>
(........)

我想要抓取的是这两行:

<td><a href="site/3845806/chlog/?log=8950501" title="View details">2018-06-20 01:13</a></td>
<td>944</td>

这些都在每个索引 2 中,我怎样才能获得所有这些值?

最佳答案

循环所有tr标签并使用jquery的find()方法来定位特定的td元素。然后使用 innerHTML = "";

清除其 html
$(".table-large1 tr").each(function() {
if ($(this).find("td").length > 0) {
$(this).find("td")[1].innerHTML = "";
$(this).find("td")[2].innerHTML = "";
}

})

$(".table-large1 tr").each(function() {
if ($(this).find("td").length > 0) {
$(this).find("td")[1].innerHTML = "";
$(this).find("td")[2].innerHTML = "";
}

})
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<table class="table table-striped table-large1">
<thead>
<tr class="small">
<th>No</th>
<th>Date/Time</th>
<th colspan="7">Indexed pages /<br> Processed / Skipped / Fetched /<br> Change (Added / Removed)</th>
<th>Proc.time</th>
<th>Bandwidth</th>
<th>Broken links</th>
<th>Images</th>
<th>Videos</th>
<th>RSS</th>
<th>News</th>
</tr>
</thead>
<tbody>
<tr class="block1">
<td>1</td>
<td><a href="site/3845806/chlog/?log=8950501" title="View details">2018-06-20 01:13</a></td>
<td>944</td>
<td>969</td>

<td><i><strike>25</strike></i></td>
<td>920</td>

<td><i style="color:#900">↓-2</i></td>
<td><i>-</i></td>
<td><i>-2</i></td>

<td>0:12:44s</td>
<td>28.82M</td>
<td>3</td>
<td>580</td>
<td>4</td>
<td>8</td>
<td>0</td>
</tr>
<tr class="block1">
<td>2</td>
<td><a href="site/3845806/chlog/?log=8934464" title="View details">2018-06-17 01:14</a></td>
<td>946</td>
<td>968</td>

<td><i><strike>22</strike></i></td>
<td>919</td>

<td></td>
<td><i>+2</i></td>
<td><i>-2</i></td>

<td>0:14:05s</td>
<td>28.89M</td>
<td>0</td>
<td>580</td>
<td>4</td>
<td>8</td>
<td>0</td>
</tr>
</table>

关于javascript - 抓取没有 ID 或类的 HTML 表格文本 - JavaScript 或 jQuery,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50985525/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com