gpt4 book ai didi

python - 如何从亚马逊产品页面中提取 asin

转载 作者:太空宇宙 更新时间:2023-11-03 12:57:57 25 4
gpt4 key购买 nike

我有以下网页Product page我正在尝试从中获取 ASIN(在本例中为 ASIN=B014MHZ90M),但我不知道如何从页面中获取它。

我正在使用 Python 3.4、Scrapy 和以下代码:

hxs = Selector(response)
product_name = "".join(hxs.xpath('//span[contains(@class,"a-text-ellipsis")]/a/text()').extract())
product_model = hxs.xpath('//body//div[@id="buybox_feature_div"]//form[@method="post"]/input[@id="ASIN"/text()').extract()

这样我就得不到必填字段(ASIN 编号)。
1.如何获取产品型号(ASIN)?

2.有没有办法调试这样的代码(我用的是PyCharm)。我无法使用调试器,只能运行它而没有看到“慢动作”中发生了什么。

先谢谢大家。

最佳答案

你可以从response.url中提取B014MHZ90M

response.url.split("/dp/")[1]

response.url.split("/dp/")[1] = B014MHZ90M

response.url.split("/dp/")[0] = http://www.amazon.com

关于python - 如何从亚马逊产品页面中提取 asin,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33625602/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com