gpt4 book ai didi

ruby-on-rails - Ruby 中的 Web 抓取 Mechanize 为浏览器生成不同的 html

转载 作者:太空宇宙 更新时间:2023-11-03 17:34:47 25 4
gpt4 key购买 nike

我对 Ruby 和 Mechanize 比较陌生,但我在使用 asp 网站时遇到了一些困难

URL: http://www.adecco.co.uk/careercentre/job-search-results.aspx?kws=&pstc=&cty=&prvnm=&pdx=1


agent = Mechanize.new
page = agent.get('http://www.adecco.co.uk/careercentre/job-search-results.aspx?kws=&pstc=&cty=&prvnm=&pdx=1')
puts page.body

我正在研究 Mechanize 网站上的示例,问题是我通过 Mechanize 返回的 HTML 与我在浏览器中使用查看源代码获得的 HTML 非常不同,我需要完成的 HTML 吗?

更新

我不太确定在这里做什么,因为问题实际上是页面随后使用 jquery 呈现内容,所以我最终使用 Selenium 获取具有正确 html 的页面,这些都不是答案实际上是错误的,所以我都投了赞成票,但都没有真正解决问题?

谢谢

马克

最佳答案

试试下面的代码,

require 'mechanize'
require 'nokogiri'

agent = Mechanize.new
page = agent.get('http://www.adecco.co.uk/careercentre/job-search-results.aspx?kws=&pstc=&cty=&prvnm=&pdx=1')

document = Nokogiri::HTML(page.content)
puts document

关于ruby-on-rails - Ruby 中的 Web 抓取 Mechanize 为浏览器生成不同的 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20386209/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com