gpt4 book ai didi

python - 我收到一个 AttributeError : 'HtmlResponse' object has no attribute 'xpath' in scrapy

转载 作者:太空宇宙 更新时间:2023-11-03 13:39:54 25 4
gpt4 key购买 nike

我是 scrapy 的新手,我正在使用 Scrapy 0.14.4。我只想按照以下示例打印标题和链接。

这是我的蜘蛛:

from scrapy.spider import BaseSpider

class XxxSpider(BaseSpider):
name = "xxx"
allow_domains = ["xxx.xxx.xxx"]
start_urls = ["http://xxx.xxx.com/jobs/"]


def parse(self, response):
for sel in response.xpath("//div[@id='job_listings']/a"):
title = sel.xpath('./text()').extract()
link = sel.xpath('./@href').extract()
print title, link

这里缺少什么?

最佳答案

问题是您使用的是旧版本的 Scrapy,其中选择器未包含在响应对象中。要验证这一点,请查看相关文档:http://doc.scrapy.org/en/0.14/topics/request-response.html

要解决您的问题,请将响应包装到选择器中,然后您可以在选择器上使用 xpath 函数:

from scrapy.selector import HtmlXPathSelector 
def parse(self, response):
hxs = HtmlXPathSelector(response)
for sel in hxs.select("//div[@id='job_listings']/a"):

关于python - 我收到一个 AttributeError : 'HtmlResponse' object has no attribute 'xpath' in scrapy,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33407140/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com