gpt4 book ai didi

python - 如何使用 scrapy python 通过 xmlfeed 循环节点

转载 作者:行者123 更新时间:2023-12-01 05:56:40 25 4
gpt4 key购买 nike

您好,我第一次使用 scrapy 并尝试 xml feed,下面是我的代码

class TestxmlItemSpider(XMLFeedSpider):
name = "TestxmlItem"
allowed_domains = {"http://www.nasinteractive.com"}


start_urls = [
"http://www.nasinteractive.com/jobexport/advance/hcantexasexport.xml"
]
iterator = 'iternodes'
itertag = 'job'


def parse_node(self, response, node):
title = node.select('title/text()').extract()
job_code = node.select('job-code/text()').extract()
detail_url = node.select('detail-url/text()').extract()
category = node.select('job-category/text()').extract()

print title,";;;;;;;;;;;;;;;;;;;;;"
print job_code,";;;;;;;;;;;;;;;;;;;;;"

item = TestxmlItem()
item['title'] = node.select('title/text()').extract()
.......
return item

结果:

  File "/usr/lib/python2.7/site-packages/Scrapy-0.14.3-py2.7.egg/scrapy/item.py", line 56, in __setitem__
(self.__class__.__name__, key))
exceptions.KeyError: 'TestxmlItem does not support field: title'

总共有 200 多个项目,所以我需要循环并将节点文本分配给项目但在这里,当我们打印时,所有结果都会立即显示,实际上我们如何在使用 xmlfeedspider

抓取 xml 文件时在节点上循环

最佳答案

来自巴勃罗·霍夫曼:

You don't have a "title" field declared in your item (TestxmlItem).

您需要添加:

title = Field()

关于python - 如何使用 scrapy python 通过 xmlfeed 循环节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12266627/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com