gpt4 book ai didi

ruby - 如何在 Ruby 中使用 Nokogiri 解析 HTML

转载 作者:太空宇宙 更新时间:2023-11-03 16:31:01 26 4
gpt4 key购买 nike

我正在尝试使用 Nokogiri 解析一些 HTML,但遇到了一些问题。我想浏览每个“employerReview”类并捕获“优点”和“缺点”下的内容。

我在做第一部分时遇到了麻烦:让一个项目返回到控制台。

require 'open-uri'
require 'nokogiri'


doc = Nokogiri::HTML(open('http://www.glassdoor.com/Reviews/Microsoft-Reviews-E1651.htm'))

doc.css('//*[@id="empReview_2320868"]/div[1]/p[1]/tt').each do |link|
puts link.content
end

最佳答案

一个问题是您正在为需要 CSS 的方法使用 XPath 访问器:

doc.css('//*[@id="empReview_2320868"]/div[1]/p[1]/tt')

您可以使用 searchxpath 代替 XPath。

虽然没有找到您想要的节点。一个简单的测试表明它们不存在:

doc.css("#empReview_2320868")

应该返回一些东西,但它返回了 [],这意味着该 ID 不存在于任何标签中。

关于ruby - 如何在 Ruby 中使用 Nokogiri 解析 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15930948/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com