gpt4 book ai didi

python - 蜘蛛内部的 Scrapyd jobid 值

转载 作者:太空狗 更新时间:2023-10-29 21:35:20 31 4
gpt4 key购买 nike

框架 Scrapy - Scrapyd 服务器。

我在获取 spider 内部的 jobid 值时遇到了一些问题。

将数据发布到 http://localhost:6800/schedule.json 后响应是

status = ok
jobid = bc2096406b3011e1a2d0005056c00008

但是我需要在这个过程中在当前蜘蛛中使用这个jobid。它可用于打开 {jobid}.log 文件或其他动态原因。

class SomeSpider(BaseSpider):
name = "some"
start_urls = ["http://www.example.com/"]
def parse(self, response):
items = []
for val in values:
item = SomeItem()
item['jobid'] = self.jobid # ???!
items.append(item)
return items

但是我只有在任务完成后才能看到这个 jobid :( 谢谢!

最佳答案

您可以从SCRAPY_JOB环境变量中获取它:

os.environ['SCRAPY_JOB']

关于python - 蜘蛛内部的 Scrapyd jobid 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9652456/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com