- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试抓取网站的所有结果页面,它可以工作,但有时脚本会停止并显示此错误:
502 => Net::HTTPBadGateway for https://website.com/id/12/ -- unhandled response (Mechanize::ResponseCodeError)
require 'mechanize'
require 'csv'
a = Mechanize.new
CSV.open('datas.csv', "wb") do |csv|
page = a.get("https://website.com/?page=1-200") #498
number = 0
page.links_with(:class => "btn btn-default").each do |link|
post_link = link.href
inside_page = a.get("https://website.com#{post_link}")
title = inside_page.at("h1.serviceTitle").text.strip
author = inside_page.at(".name").text.strip
number+=1
csv << [title, author]
end
end
最佳答案
这可以通过适当的异常处理轻松解决。您可以check this page for a better explanation
至于你的代码,你可以像这样处理异常
CSV.open('datas.csv', "wb") do |csv|
begin
a = Mechanize.new
page = a.get("https://website.com/?page=1-200") #498
number = 0
page.links_with(:class => "btn btn-default").each do |link|
post_link = link.href
inside_page = a.get("https://website.com#{post_link}")
title = inside_page.at("h1.serviceTitle").text.strip
author = inside_page.at(".name").text.strip
number+=1
csv << [title, author]
end
rescue => e
// do nothing and move on to the next line
end
end
关于Ruby Mechanize 抓取 ResponseCodeError,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46832980/
我正在尝试抓取网站的所有结果页面,它可以工作,但有时脚本会停止并显示此错误: 502 => Net::HTTPBadGateway for https://website.com/id/12/ --
submit_form = agent.get("http://sample.com/NewTask.aspx").form("aspnetForm") do |f| f["ctl00$Con
我尝试在其他线程上寻找答案,但觉得这些回复与我的情况无关(如果情况并非如此,我深表歉意)。也就是说,我正在尝试在 irb 中运行一个简单的 ruby 脚本 > require 'mecha
试图刮 图片来自 https://en.wikipedia.org/网站使用 Mechanize gem 。我收到 Mechanize::ResponseCodeError (404 => Net::
我负责使用 Cucumber 测试非 Rails 网络应用程序。我已经启动并运行了基本测试,I.E.我可以做类似的事情 Then /^the page should have a header$/ d
尝试使用 Mechanize 浏览 KBB.com。我创建了一个新代理 agent = Mechanize.new 工作正常。 page = agent.get('http://www.kbb.com
我是一名优秀的程序员,十分优秀!