gpt4 book ai didi

ruby - 使用 Nokogiri 获取嵌套在 div 元素中的 div

转载 作者:数据小太阳 更新时间:2023-10-29 01:44:16 25 4
gpt4 key购买 nike

对于以下 HTML,我想使用 Nokogiri 解析它并获得以下结果。

event_name = "folk concert 2"   
event_link = "http://www.douban.com/event/12761580/"
event_date = "20th,11,2010"

我知道 doc.xpath('//div[@class="nof clearfix"]') 可以获取每个 div 元素,但我应该如何继续获取每个属性,例如 event_name,尤其是 date?

HTML

 <div class="nof clearfix">        
<h2><a href="http://www.douban.com/event/12761580/">folk concert 2</a> <span class="pl2"> </span></h2>
<div class="pl intro">
Date:25th,11,2010<br/>
</div>
</div>
<div class="nof clearfix">
<h2><a href="http://www.douban.com/event/12761581/">folk concert </a> <span class="pl2"> </span></h2>
<div class="pl intro">
Date:10th,11,2010<br/>
</div>
</div>

最佳答案

我不知道 xpaths,我更喜欢使用 css 选择器,它们对我来说更有意义。 This tutorial可能对您有用。

require 'rubygems'
require 'nokogiri'
require 'pp'

Event = Struct.new :name , :link , :date

doc = Nokogiri::HTML DATA

events = doc.css("div.nof.clearfix").map do |eventnode|
name = eventnode.at_css("h2 a").text.strip
link = eventnode.at_css("h2 a")['href']
date = eventnode.at_css("div.pl.intro").text.strip
Event.new name , link , date
end

pp events


__END__
<div class="nof clearfix">
<h2><a href="http://www.douban.com/event/12761580/">folk concert 2</a> <span class="pl2"> </span></h2>
<div class="pl intro">
Date: 25th,11,2010<br/>
</div>
</div>
<div class="nof clearfix">
<h2><a href="http://www.douban.com/event/12761581/">folk concert </a> <span class="pl2"> </span></h2>
<div class="pl intro">
Date: 10th,11,2010<br/>
</div>
</div>

这个输出:

[#<struct Event
name="folk concert 2",
link="http://www.douban.com/event/12761580/",
date="Date: 25th,11,2010">,
#<struct Event
name="folk concert",
link="http://www.douban.com/event/12761581/",
date="Date: 10th,11,2010">]

关于ruby - 使用 Nokogiri 获取嵌套在 div 元素中的 div,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4232345/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com