gpt4 book ai didi

python - scrapy 中 request.headers.setdefault() 的含义是什么

转载 作者:太空宇宙 更新时间:2023-11-04 08:37:15 26 4
gpt4 key购买 nike

我想用 scrapy 设置自定义 UserAgentMiddleware。但是我看到的时候并不知道request.headers.setdefault('User-Agent', ua)的 Action ,也没有找到scrapy和requests文档中的方法。

我在哪里可以找到关于它的任何解释?

最佳答案

headers 是一个普通的字典,因此 setdefault 将是一种为该字典设置值的方法如果该值不存在 已经。

解释是,仅当您尚未在蜘蛛进程中设置用户代理时,中间件才默认设置用户代理。

你可以在你的蜘蛛代码中设置这样的东西:

...
request.headers['User-Agent'] = 'My Custom User Agent'
yield request

这意味着当该代码到达中间件时,用户代理不会被覆盖或更改。

在此之前出现的其他中间件(或任何其他进程)也可以修改 User-Agent,并且不会被此代码更改,因为它尊重之前的那些设置。

关于python - scrapy 中 request.headers.setdefault() 的含义是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48050573/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com