gpt4 book ai didi

html - 我如何使用 Nokogiri 解析 Google 搜索结果?

转载 作者:太空狗 更新时间:2023-10-29 14:06:39 26 4
gpt4 key购买 nike

我需要帮助从 Google 搜索结果中提取 URL,并被告知使用 Nokogiri。我安装了它并阅读了 Nokogiri 文档,但不知道从哪里开始——这对我来说全是希腊语。

我知道我正在寻找的是每个结果的 URL,每个结果都存在于 <cite> 之间。标签。到目前为止,我所能弄清楚的是如何提取搜索结果,但我只是不知道如何从文件中提取特定数据。这是我拥有的一小段代码:

serp = Nokogiri::HTML(open("http://www.google.com/search?num=100&q=stackoverflow"))

最佳答案

享受:)

require 'open-uri'
require 'nokogiri'

page = open "http://www.google.com/search?num=100&q=stackoverflow"
html = Nokogiri::HTML page

html.search("cite").each do |cite|
puts cite.inner_text
end

另见nokogiri tutorials

关于html - 我如何使用 Nokogiri 解析 Google 搜索结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6016742/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com