gpt4 book ai didi

ruby - 如何在 ruby​​ 中抓取下一页

转载 作者:行者123 更新时间:2023-12-04 16:22:49 26 4
gpt4 key购买 nike

我正在尝试抓取名为 https://www.jobsatosu.com/postings/search 的网站的下一页.因为作业多,所以页面多。我们的团队像这样成功地抓取了第一页:

def initialize
@agent_menu = Mechanize.new
@page = @agent_menu.get(PAGE_URL)
@form = @page.forms[0]

我正在努力抓取下一页。此外,我们被告知在 Ruby 中使用 Nokogiri 和 Mechanize。我只需要抓取下一页而不必解析它。

这就是我所做的:
def next_page
@page_num += 1
new_url = "https://www.jobsatosu.com/postings/search?page=#{@page_num}"
@new_page = @agent_menu.get(new_url)
@new_form = @new_page.forms[0]
end

我做了一个 page_num供大家分享。如果有人调用该方法,那么它会被迭代 1 并获得新的 URL,并将其放入 @new_page .
我还没有测试过这个,但是对这段代码有什么想法吗?

最佳答案

您需要初始化 @page_num = 0使用前

第一时间@page_num是零所以 @page_num += 1 引发执行
NoMethodError: undefined method '+' for nil:NilClass
实际上你在使用之前没有描述变量,但在这种情况下,你需要做

关于ruby - 如何在 ruby​​ 中抓取下一页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60236059/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com