- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个蜘蛛,其中抓取的项目为 3:来自同一页面的品牌、型号和价格。
品牌和型号使用相同的 sel.xpath,稍后通过循环中的 .re 进行提取和区分。然而,价格项目使用不同的xpath。如何在蜘蛛中使用或组合两个 XPathSelector?
示例:
品牌和型号:
titles = sel.xpath('//table[@border="0"]//td[@class="compact"]')
价格:
prices = sel.xpath('//table[@border="0"]//td[@class="cl-price-cont"]//span[4]')
通过 xpath 单独测试和导出。我的问题是将这两个结合起来构建正确的循环。
有什么建议吗?
谢谢!
最佳答案
如果您稍后可以区分所有 3 种商品(品牌、型号、价格),您可以尝试使用 XPath 联合 (|
) 将两个 XPath 查询捆绑到一个选择器中:
//table[@border="0"]//td[@class="compact"]
|
//table[@border="0"]//td[@class="cl-price-cont"]//span[4]
更新:
回应您的评论,上面是单个 XPath 字符串。我没有使用 python,但我认为它应该是这样的:
sel.xpath('//table[@border="0"]//td[@class="compact"] | //table[@border="0"]//td[@class="cl-price-cont"]//span[4]')
关于python-2.7 - 在同一页面上使用两个 xpathselector,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23036998/
我正在尝试使用 scrapy 爬虫从网站爬取数据。如何获取使用 select() 获取内容值? 最佳答案 item['key'] = xpath.select('//meta[@itemprop="r
我有一个蜘蛛,其中抓取的项目为 3:来自同一页面的品牌、型号和价格。 品牌和型号使用相同的 sel.xpath,稍后通过循环中的 .re 进行提取和区分。然而,价格项目使用不同的xpath。如何在蜘蛛
晚上好,感谢您的帮助。 我正在挖掘 Scrappy,我的需要是从网站获取信息并重新创建该网站的相同树结构。示例: books [ python [ first [ title = 'T
给定 XML: Text 我想要 XPath /root/@name返回 value , 和 XPath /root/level1返回 的 XML 序列化节点:
我对使用 Scrapy 或 python 比较陌生。我希望从几个不同的链接中提取,但在使用 HTMLXPathSelector 表达式(语法)时遇到问题。我已经查看了大量文档以了解正确的语法,但尚未找
我是一名优秀的程序员,十分优秀!