gpt4 book ai didi

css - 通过 nokogiri 和 xpath 解析图像

转载 作者:太空宇宙 更新时间:2023-11-04 04:42:43 24 4
gpt4 key购买 nike

我目前有一段代码可以获取产品名称、描述和价格,而且效果很好。但是,我还需要它来获取图像 URL,这是我的困境所在。我尝试在底部的循环中使用 xpath,它列出了我根本不想要的每个产品上等于 220 的所有图像。所以基本上我得到这样的东西....

产品 1 标题在这里
这里是产品1的描述
这里是产品 1 的价格
http://www.test.com/product1.jpg
http://www.test.com/product2.jpg
http://www.test.com/product3.jpg
http://www.test.com/product4.jpg


产品 2 标题在这里
这里是产品2的描述
这里是产品2的价格
http://www.test.com/product1.jpg
http://www.test.com/product2.jpg
http://www.test.com/product3.jpg
http://www.test.com/product4.jpg

我显然希望产品 1 只包含 http://www.test.com/product1.jpg和产品 2 有 http://www.test.com/product2.jpg等等,等等。图像只是在没有类或 ID 的 div 标签中,因此我为什么不轻易将它们放入 css 选择器中。我对 ruby​​/nokogiri 真的很陌生,所以任何帮助都会很棒。

require 'nokogiri'
require 'open-uri'


url = "http://thewebsitehere"

data = Nokogiri::HTML(open(url))

products = data.css('.item')



products.each do |product|
puts product.at_css('.vproduct_list_title').text.strip
puts product.at_css('.vproduct_list_descr').text.strip
puts product.at_css('.price-value').text.strip
puts product.xpath('//img[@width = 220]/@src').map {|a| a.value }

end

最佳答案

尝试改变:

puts product.xpath('//img[@width = 220]/@src').map {|a| a.value }

到:

puts product.xpath('.//img[@width = 220]/@src').map {|a| a.value }

'.' 的点也就是说,您想要所有作为当前节点子节点的图像(例如,这样您就不会偷看产品 2 的图像)。

关于css - 通过 nokogiri 和 xpath 解析图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15120523/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com