gpt4 book ai didi

python - Scrapy Spider - 响应回调中的循环不迭代

转载 作者:行者123 更新时间:2023-11-28 17:41:53 27 4
gpt4 key购买 nike

我正在尝试在此 SO 线程中使用“warwaruk”描述的链接解析结构: Following links, Scrapy web crawler framework

这在仅从每个页面抓取单个项目时效果很好。但是,当我尝试创建一个 for 循环来抓取每个页面中的所有项目时,parse_item 函数似乎在到达第一个 yield 语句时终止。我有一个自定义管道设置来处理每个项目,但目前它每页只接收一个项目。

如果我需要包含更多代码或说明,请告诉我。谢谢!

def parse_item(self,response):  
hxs = HtmlXPathSelector(response)
prices = hxs.select("//div[contains(@class, 'item')]/script/text()").extract()
for prices in prices:
item = WalmartSampleItem()
...
yield items

最佳答案

您应该在 for 循环中 yield 单个 item,而不是 items:

for prices in prices:
item = WalmartSampleItem()
...
yield item

关于python - Scrapy Spider - 响应回调中的循环不迭代,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23162037/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com