- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我正在尝试用 ruby 编写一个简单的网络抓取代码。它一直工作到第 29 个 url,然后我收到此错误消息:
C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:346:in `open_http': 500 Internal Server Er
ror (OpenURI::HTTPError)
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:775:in `buffer_open'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:203:in `block in open_loop'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:201:in `catch'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:201:in `open_loop'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:146:in `open_uri'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:677:in `open'
from C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:33:in `open'
from test.rb:24:in `block (2 levels) in <main>'
from test.rb:18:in `each'
from test.rb:18:in `block in <main>'
from test.rb:14:in `each'
from test.rb:14:in `<main>'
我的代码:
require 'rubygems'
require 'nokogiri'
require 'open-uri'
aFile=File.new('data.txt', 'w')
ag = 0
for i in 1..40 do
agenzie = ag + 1
#change url parameter
url = "http://www.infotrav.it/dettaglio.do?sort=*RICOVIAGGI*&codAgenzia=" + "#{ ag }"
doc = Nokogiri::HTML(open(url))
aFile=File.open('data.txt', 'a')
aFile.write(doc.at_css("table").text)
aFile.close
end
你有什么解决办法吗?谢谢!
aS
最佳答案
在这里,让我为您清理一下:
File.open('data.txt', 'w') do |aFile|
(1..40).each do |ag|
url = "http://www.infotrav.it/dettaglio.do?sort=*RICOVIAGGI*&codAgenzia=#{ag}"
response = open(url) rescue nil
next unless response
doc = Nokogiri::HTML(response)
aFile << doc.at_css("table").text
end
end
注意事项:
关于RUBY - 网页抓取 - (OpenURI::HTTPError),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12736201/
鲁比的 OpenURI提供一个 content_length_proc 选项,允许在实际传输开始之前确定*内容长度: open(url, :content_length_proc => lambda
我正在尝试用 ruby 编写一个简单的网络抓取代码。它一直工作到第 29 个 url,然后我收到此错误消息: C:/Ruby193/lib/ruby/1.9.1/open-uri.rb:346:i
我想从这个页面获取数据: http://www.canadapost.ca/cpotools/apps/track/personal/findByTrackNumber?trackingNumber=
我正在使用 OpenUri 从 HTTPS 服务器读取 JSON 文件。几天前它工作正常,但今天早上我得到: OpenSSL::SSL::SSLError: SSL_connect returned=
我正在测试方法如何处理 302 HTTPError 异常。我试图 stub 一个方法调用以编程方式引发一个,但是它一直提示错误的参数数量错误(0 代表 2) 代码测试了这一行: document =
我正在尝试使用 OpenURI 从 S3 下载文件,然后将其保存在本地,以便我可以使用 ActionMailer 将文件作为附件发送。 有些奇怪的事情正在发生。正在下载和附加的图像已损坏,图像的底部丢
我正在使用 Ruby 1.9.3 并运行以下命令: open("ftp://user name:password@datafeeds.domain.com/1234/1234.txt.gz") 返回:
我正在尝试从控制台中的全新 Rails 项目运行以下代码段: uri = URI.parse("http://25.media.tumblr.com/avatar_279ec8ee3427_64.pn
我正在使用 wikipedia-api 插件从维基百科获取内容页面。 从某些天开始,当我尝试获取内容时会收到此错误: page = Wikipedia.find_by_titles('Foo')
我正在尝试使用以下脚本从我的 Google+ API 中提取数据: require 'open-uri' require 'json' google_api_key = 'put your googl
我对此进行了很多搜索,但没有一个能帮助我。 当我运行我的项目时,出现此错误: /home/ali/Desktop/personalitytest-backend/node_modules/mongoo
我有一个 cron 作业定期从外部服务 (Twilio) 下载 mp3 文件然后使用 Paperclip 将文件上传到 Amazon S3 的设置。该过程由 Resque 在后台处理。 下面是处理从
我最近在使用 OpenURI 时遇到了问题。每个 open 方法都会导致以下错误: "No such file or directory @ rb_sysopen". 我的代码如下所示: data =
我使用 open-uri 从远程网站获取图像,并将它们保存在我的 Ruby on Rails 应用程序中的本地服务器上。大多数图像显示没有问题,但有些图像没有显示。 经过很长时间的调试 session
我正在尝试使用 Ruby 的 OpenURI gem 调用 URL,但是它需要我在其 HTTP 请求 header 中传递某些值。 知道怎么做吗? 最佳答案 根据 the documentation
好的, 我正在编写无处不在的爬虫,但遇到了一些问题。 ~完全是 Ruby 的菜鸟也就不足为奇了。 我使用 Nokogiri 获取页面的 html - 在其中找到我感兴趣的所有链接,然后下载与这些链接关
如果我调用 Gdx.net.openURI("") 然后我返回游戏,GoogleApiClient 断开连接。为什么?? if (event.getTarget().getName().equals(
我的代码有问题,我在其中使用了此代码应用程序.js: const mongoose = require('mongoose'); const dotenv = require('dotenv'); d
在以下文档中找到:https://ruby-doc.org/stdlib-2.1.0/libdoc/open-uri/rdoc/OpenURI.html Additional header field
我添加的功能是从需要使用带身份验证的 HTTPS 连接的源中抓取 XML 页面。我正在尝试使用 Ryan Bates 的 Railscast #190 解决方案,但遇到了 401 身份验证错误。 这是
我是一名优秀的程序员,十分优秀!