gpt4 book ai didi

python - 如何从不同的url获取xpath,由start_requests方法返回

转载 作者:太空宇宙 更新时间:2023-11-03 18:00:16 26 4
gpt4 key购买 nike

这是我的scrapy代码:

import scrapy
from scrapy.spider import BaseSpider
from scrapy.selector import Selector
import MySQLdb


class AmazonSpider(BaseSpider):
name = "amazon"
allowed_domains = ["amazon.com"]
start_urls = []

def parse(self, response):
print self.start_urls

def start_requests(self):
conn = MySQLdb.connect(user='root',passwd='root',db='mydb',host='localhost')
cursor = conn.cursor()
cursor.execute(
'SELECT url FROM products;'
)
rows = cursor.fetchall()
for row in rows:
yield self.make_requests_from_url(row[0])
conn.close()

如何获取 start_requests 函数返回的 url 的 xpath?

注意:url 属于不同的域,而不是相同的。

最佳答案

yield 使 start_requests 函数成为生成器。使用 for 循环获取其返回的每个结果。

像这样:

...
my_spider = AmazonSpider()
for my_url in my_spider.start_requests():
print 'we get URL: %s' % str(my_url)
...

关于python - 如何从不同的url获取xpath,由start_requests方法返回,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27794432/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com