gpt4 book ai didi

ruby - Nokogiri:遇到 nil:NilClass 错误 "undefined method ‘text’”

转载 作者:数据小太阳 更新时间:2023-10-29 07:11:18 30 4
gpt4 key购买 nike

我是程序员的新手,请原谅我的新手。所以我正在使用 Nokogiri 来抓取警方的犯罪记录。这是下面的代码:

require 'rubygems'
require 'nokogiri'
require 'open-uri'

url = "http://www.sfsu.edu/~upd/crimelog/index.html"
doc = Nokogiri::HTML(open(url))
puts doc.at_css("title").text
doc.css(".brief").each do |brief|
puts brief.at_css("h3").text
end

我使用选择器小工具书签来查找日志 (.brief) 的 CSS 选择器。当我通过 brief.at_css 传递“h3”时,我得到了所有带有内容的 h3 标签。

但是,如果我添加 .text 方法来删​​除标签,我会收到 NoMethod 错误。

发生这种情况有什么原因吗?我错过了什么?谢谢!

最佳答案

澄清一下,如果您查看 HTML 源代码的结构,您会发现第一次出现的 <div class="brief">没有 child h3标签(它实际上只有一个子 <p> 标签)。

Nokogiri Docs这么说

at_css(*rules)

Search this node for the first occurrence of CSS rules. Equivalent to css(rules).first See Node#css for more information.

如果您调用 at_css(*rules)文档声明它等同于 css(rules).first .当有项目时(你的 .brief 类包含一个 h3 )然后一个 Nokogiri::XML::Element返回响应 text 的对象,而如果你的 .brief不包含 h3然后是NilClass返回对象,当然不会响应 text

所以如果我们调用 css(rules) (不是你的 at_css)我们得到一个 Nokogiri::XML::NodeSet返回的对象,其中有 text()方法定义为(注意 alias )

# Get the inner text of all contained Node objects
def inner_text
collect{|j| j.inner_text}.join('')
end
alias :text :inner_text

因为类(class)是Enumerable它迭代它的 child 调用他们的 inner_text方法并将它们连接在一起。

因此您可以执行 nil?检查或@floatless 正确说明只需使用 css方法

关于ruby - Nokogiri:遇到 nil:NilClass 错误 "undefined method ‘text’”,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7154020/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com