ruby Mechanize 404 => 网络::HTTPNotFound-6ren

ruby Mechanize 404 => 网络::HTTPNotFound

转载作者：数据小太阳更新时间：2023-10-29 07:31:46

25

4

我有一个无法使用 Mechanize 访问的 URL，我不知道为什么:

# Use ruby 2.1.6
require 'mechanize'
require 'axlsx' # 2.0.1
require 'roo' # 1.13.2

mechanize = Mechanize.new
mechanize.request_headers = { "Accept-Encoding" => "" }
mechanize.ignore_bad_chunking = true
mechanize.follow_meta_refresh = true

xlsx = Roo::Excelx.new("./base_list.xlsx")

xlsx.each_with_pagename do |page, sheet|
  sheet.each do |row|
    page = mechanize.get(row[0])
  end
end

当我遍历我的列表时，我得到的 url 如下:https://angel.co/_helencousins ，我可以用我的浏览器访问它，但不能用 Mechanize，我有这个错误:

/.rvm/gems/ruby-2.1.6/gems/mechanize-2.7.4/lib/mechanize/http/agent.rb:316:in `fetch': 404 => Net::HTTPNotFound for https://angel.co/_helencousins -- unhandled response (Mechanize::ResponseCodeError)
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/mechanize-2.7.4/lib/mechanize.rb:464:in `get'
    from scraper.rb:15:in `block (2 levels) in <main>'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:428:in `block in each'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:427:in `upto'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:427:in `each'
    from scraper.rb:14:in `block in <main>'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:398:in `block in each_with_pagename'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:397:in `each'
    from /Users/xxx/.rvm/gems/ruby-2.1.6/gems/roo-1.13.2/lib/roo/base.rb:397:in `each_with_pagename'
    from scraper.rb:13:in `<main>'

最佳答案

好的，

问题是网站禁用了 Mechanize 用户代理。

我只是将其更改为:mechanize.user_agent_alias = 'Windows Chrome'

关于 ruby Mechanize 404 => 网络::HTTPNotFound，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34749136/

25

4

0

文章推荐： ruby-on-rails - 无法在 Ubuntu 14.04 上安装 kgio 2.8.1

文章推荐： ruby-on-rails - 从gem继承一个类并添加本地方法

文章推荐： ruby - 并行安装 gem(更快)

ruby Mechanize 404 => 网络::HTTPNotFound
我有一个无法使用 Mechanize 访问的 URL，我不知道为什么: # Use ruby 2.1.6 require 'mechanize' require 'axlsx' # 2.0.1 req
ruby-on-rails - Ruby HTTPNotFound 错误与 Mechanize
我有一个 ruby on rails 应用程序，它试图访问 Yahoo Sports 上的各种链接，有时当它尝试访问某个页面时，它会出现以下错误。错误是一致的，它失败的任何链接，它总是失败。这不是
python - 如何在 Pyramid 中包含 HTTPNotFound 错误中的链接？
我的网站的一部分是 wiki 引擎。当页面不存在时，我想提供一个自定义 404 错误页面，其中包含用于创建新页面的链接。此自定义 404 应该仅在失败的 wiki 页面 View 的上下文中出现。为
python - Pyramid .httpexceptions.HTTPNotFound : The resource could not be found
我正在研究 Safari 的 Pyramid 教程 WEB APPLICATIONS WITH PYTHON AND THE PYRAMID FRAMEWORK 在我的 views.py 文件中，我遇
ruby - 捕捉 Mechanize 404 => Net::HTTPNotFound
我写了一个简单的函数来处理 url 的获取: def tender_page_get url, agent sleep(rand(6)+2) begin return agent.ge
ruby - Mechanize::ResponseCodeError(404 => Net::HTTPNotFound 未处理的响应):
试图刮图片来自 https://en.wikipedia.org/网站使用 Mechanize gem 。我收到 Mechanize::ResponseCodeError (404 => Net::
c#-4.0 - MVC2 中 HttpNotFound 的替代方案
我正在尝试从 asp.net 网站示例应用程序中学习 ASP.Net MVC MVCMovieApplication .此应用程序是为 MVC3 编写的。我被困在下面的部分。有人可以帮我解决这个问题吗
asp.net-mvc - MVC 4 HttpNotFound() 和 404 错误
我有一个 Controller ，我在其中处理 url 的一部分，如果它符合某些条件，我将返回一个 View ，但如果不匹配，我将返回一个 HttpNotFound() . 现在我已经设置了一个友好的
c# - ASP.NET MVC 和 C# : HttpStatusCodeResult() vs HttpNotFound()
在ASP.NET MVC中，返回this有什么区别: return new HttpStatusCodeResult(HttpStatusCode.NotFound); 还有这个: return
forms - 使用 capybara-mechanize 进行远程测试:表单提交导致 URL 不正确(404 => Net::HTTPNotFound)
正在测试的应用程序:在 Vagrant 虚拟机上运行的 CakePHP 应用程序进行测试的应用程序:带有 capybara-mechanize 的本地(基本空白)Rails 应用程序 10 exa
asp.net - 如何在 ASP.Net MVC 3 中返回 HttpNotFound() 的 View ？
每次从 Controller 返回 HttpNotFoundResult 时，有没有办法返回相同的 View ？你如何指定这个 View ？我猜测在 web.config 中配置 404 页面可能会起

首页

博学

6Ren·AI

商城

ruby Mechanize 404 => 网络::HTTPNotFound