gpt4 book ai didi

css - 如何只选择里面有特定内容的表格行

转载 作者:太空宇宙 更新时间:2023-11-04 09:33:36 24 4
gpt4 key购买 nike

我正在抓取一封包含许多表格行的电子邮件,其中一些我想排除。我确实需要的表格行看起来完全像:

<tr>
<td class="quantity"> ANYTHING BUT EMPTY </td>
<td class="description"> ANYTHING BUT EMPTY </td>
<td class="price"> ANYTHING BUT EMPTY </td>
</tr>

所有表行都没有类或 ID。此外,还有不需要的<table>包含具有这些类的单元格但有些没有值的行,因此我只需要获取具有这三类单元格的表行,以及所有三个具有非空值的单元格。我不确定执行此操作的语法:

body = Nokogiri::HTML(email)
wanted_rows = body.css('tr').select{ NOT SURE HOW TO ENCAPSULATE LOGIC HERE }

最佳答案

这对于 XPath 来说相当简单:

wanted_rows = body.xpath('//tr[td[(@class = "quantity") and normalize-space()]
and td[(@class = "description") and normalize-space()]
and td[(@class = "price") and normalize-space()]]')

normalize-space() 调用实际上与 normalize-space(.) != "" 相同,即它们检查当前节点(td) 包含的不仅仅是空格。

关于css - 如何只选择里面有特定内容的表格行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40569671/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com