gpt4 book ai didi

ruby - 如何在 HTML 中抓取没有样式的文本?

转载 作者:数据小太阳 更新时间:2023-10-29 08:38:59 25 4
gpt4 key购买 nike

我正在尝试抓取一个没有关联 CSS 的时间戳值:

<a href="famg.xml">famg.xml</a>              05-Sep-2012 22:21   32M   
<a href="file.203.xml">file.203.xml</a> 12-Apr-2013 21:02 11K
<a href="file.202.xml">file.202.xml</a> 13-Apr-2013 16:08 1.7K
<a href="file.201.xml">file.201.xml</a> 14-Apr-2013 16:14 1.8K
<a href="file.212.xml">file.212.xml</a> 16-Apr-2013 09:02 1.1K

如果我使用 doc.css('a') , 我得到了所有 <a>元素,但是当我查看时间戳值时,它在 <a> 之外并且没有与之关联的 CSS。

我想读取每个文件名及其时间戳,并确定它是否是今天生成的。

最佳答案

您可以在您选择的每个 'a' 元素上使用 next_sibling.text

doc.css('a').each { |x|
puts x.next_sibling.text
}

关于ruby - 如何在 HTML 中抓取没有样式的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16283367/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com