作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在特定网站上爬网一个网页。该网页对于通过scrapy.Request()
发送的不同Cookie集合有所不同。
如果我一一请求到网页,它会给我正确的结果,但是当我在for循环中发送这些cookie时,它会给我相同的结果。我认为scrapy正在为我创建缓存,在第二个请求中,它从该缓存中获取了响应,这是我的代码:
def start_requests(self):
meta = {'REDIRECT_ENABLED':True}
productUrl = "http://xyz"
cookies = [{'name': '', 'value': '=='},{'name': '', 'value': '=='}]
for cook in cookies:
header = {"User-Agent":"Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.85 Safari/537.36"}
productResponse = scrapy.Request(productUrl,callback=self.parseResponse,method='GET',meta=meta,body=str(),cookies=[cook],encoding='utf-8',priority=0,dont_filter=True)
yield productResponse
def parseResponse(self,response):
selector = Selector(response)
print selector.xpath("xpaths here").extract()
yield None
最佳答案
缓存可以通过两种方式禁用
关于caching - 如何禁用scrapy中的缓存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32615250/
我是一名优秀的程序员,十分优秀!