gpt4 book ai didi

ruby-on-rails - 方法 width 和 height Mechanize

转载 作者:行者123 更新时间:2023-12-04 16:20:54 26 4
gpt4 key购买 nike

我正在使用 Mechanize 来抓取图像 url 然后我正在寻找 http://mechanize.rubyforge.org/Mechanize/Page/Image.html用于了解宽度和高度图像。

我在控制台写:

url = "http://www.bbc.co.uk/"
page = Mechanize.new.get(url)
images_url = page.images.map{|img| img.width}.compact

我得到结果:
["1", "84", "432", "432", "432", "432", "432", "432", "432", "304", "144", "144", "144", "144", "144", "144", "432", "432", "432", "432", "432", "432", "432", "336", "62", "62", "62", "62", "84", "1", "0"]

这个结果对我来说很好,我得到了图像的宽度。

但是,对于其他网页,我得到了零,例如您可以查看此网页:
url = "http://www.glamourum.com" #check also with https://www.birchbox.com/
page = Mechanize.new.get(url)
images_url = page.images.map{|img| img.width}.compact

我得到一个结果:
=> []

空数组 :O 或 https://www.birchbox.com/我得到一个数组:
=> ["1", "1", "1", "1", "1"]

为什么有些网站会发生这种情况而其他网站不会发生这种情况?

这个问题的解决方案是什么?

最佳答案

Mechanize 不获取图像。它只能返回 img 上反射(reflect)的尺寸。 HTML 中的标记,很多网站不包含该标记。

关于ruby-on-rails - 方法 width 和 height Mechanize ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9447571/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com