gpt4 book ai didi

python - 使用 python 和 bs4 抓取后的不同数据

转载 作者:行者123 更新时间:2023-12-05 06:20:44 25 4
gpt4 key购买 nike

我正在尝试获取亚马逊上的评论数量。但是,当我获取数据时,它与网站上的数据不同。(131 是在抓取之后,655 来自亚马逊)我附上页面截图和抓取后的截图。

131 reviews

655 reviews

From inspect element

import bs4
import requests
import time


url3 = "https://www.amazon.it/dp/B076S8NSCD"

headers = {"User-Agent" : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.5 Safari/605.1.15'}

res = requests.get(url3, headers = headers)

soup = bs4.BeautifulSoup(res.text, "html.parser")


reviews = soup.find(id = "acrCustomerReviewText").get_text()
print(reviews)

最佳答案

如果您没有使用高级版 rotating residential proxies要抓取亚马逊评论,这很可能是一种伪装措施,您的 IP 被标记为发送过多请求。

关于python - 使用 python 和 bs4 抓取后的不同数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60282010/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com