gpt4 book ai didi

python - 在 python 中使用 lxml 和 xpath 获取空列表

转载 作者:太空宇宙 更新时间:2023-11-03 20:26:49 24 4
gpt4 key购买 nike

所以我有这个代码应该可以获取亚马逊上任何商品的价格。然而,我没有得到价格,而是得到了一个空 list 。

from lxml import html
import requests

page = requests.get('https://www.amazon.com/gp/product/B06XP634L1?pf_rd_p=183f5289-9dc0-416f-942e-e8f213ef368b&pf_rd_r=W4XQCYJ4N9VQGF8HDAH0')
doc = html.fromstring(page.content)
price = doc.xpath("//span[@id='priceblock_ourprice']")
print(price)

这之前对我有用。我将不胜感激任何帮助。提前致谢。

最佳答案

您需要添加 User-Agent header

from lxml import html
import requests

headers = {'User-Agent':'Mozilla\5.0'}
page = requests.get('https://www.amazon.com/gp/product/B06XP634L1?pf_rd_p=183f5289-9dc0-416f-942e-e8f213ef368b&pf_rd_r=W4XQCYJ4N9VQGF8HDAH0', headers = headers)
doc = html.fromstring(page.content)
price = doc.xpath("//span[@id='priceblock_ourprice']")
print(price[0].text)
<小时/>

或者

price = doc.xpath("//span[@id='priceblock_ourprice']/text()")
print(price)
<小时/>

bs4

from bs4 import BeautifulSoup as bs
import requests

headers = {'User-Agent':'Mozilla\5.0'}
page = requests.get('https://www.amazon.com/gp/product/B06XP634L1?pf_rd_p=183f5289-9dc0-416f-942e-e8f213ef368b&pf_rd_r=W4XQCYJ4N9VQGF8HDAH0', headers = headers)
soup = bs(page.content, 'lxml')
price = soup.select_one("#attach-base-product-price")['value']
print(price)

关于python - 在 python 中使用 lxml 和 xpath 获取空列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57758880/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com