gpt4 book ai didi

scrapy 单个蜘蛛将多个项目类传递给管道

转载 作者:行者123 更新时间:2023-12-01 10:03:02 25 4
gpt4 key购买 nike

我是 scrapy 的新手。在 items.py 中,我声明了 2 个名为 ItemClass1 和 ItemClass2 的 ItemClass。蜘蛛方法 parseUrl 获取 html 和抓取数据,并将其放入相应项目类的列表中。

e.g:
C1Items = []
C1Item = ItemClass1()
#scrape data
C1Items.append(C1Item)
...
C2Items = []
C2Item = ItemClass2()
#scrape data
C2Items.append(C2Item)
...

最后:C1Items 和 C2Items 包含所需的数据。

return C1Items #will pass ItemClass1 data to pipeline
return C2Items #will pass ItemClass2 data to pipeline

能否请您告知将 C1Items、C2Items 都传递到管道的最佳方法是什么?

最佳答案

要么将不同类的所有项目组合成一个列表并返回该列表,要么使用 yield 语句:

C1Item = ItemClass1()
#scrape data
yield C1Item
...
C2Item = ItemClass2()
#scrape data
yield C2Item

关于scrapy 单个蜘蛛将多个项目类传递给管道,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14069236/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com