gpt4 book ai didi

python - 使用 beautifulsoup 抓取 Flipkart 网页

转载 作者:行者123 更新时间:2023-12-01 04:12:24 26 4
gpt4 key购买 nike

我正在尝试在 Flipkart 上抓取此页面:

http://www.flipkart.com/moto-x-play/p/itmeajtqp9sfxgsk?pid=MOBEAJTQRH4CCRYM&ref=L%3A7224647610489585789&srno=p_1&query=moto+x+play&otracker=from-search

我试图找到类为“fk-ui-ccarousel-supercontainer Same-vreco-section reco-carousel-border-top SameHorizo​​ntalReco”的 div,但它返回空结果。

from bs4 import BeautifulSoup
import requests

url = "http://www.flipkart.com/moto-x-play/p/itmeajtqp9sfxgsk?pid=MOBEAJTQRH4CCRYM&ref=L%3A7224647610489585789&srno=p_1&query=moto%20x%20play&otracker=from-search"

page = requests.get(url)

soup = BeautifulSoup(page.text)

divs = soup.find_all("div",{"class":"fk-ui-ccarousel-supercontainer same-vreco-section reco-carousel-border-top sameHorizontalReco"})

print divs

div 为空。我使用检查元素复制了类名。

我在这个问题中找到了答案。 http://www.google.com/url?q=http%3A%2F%2Fstackoverflow.com%2Fquestions%2F22028775%2Ftried-python-beautifulsoup-and-phantom-js-still-cant-scrape-websites&sa=D&sntz=1&usg=AFQjCNFOZIMVyUDcUqNNuv-05Dp7P_L6-g

最佳答案

当您使用 requests.get(url) 时,您会加载 url 的 HTML 内容,无需启用 JavaScript。如果不启用 JavaScript,则页面中名为“查看此产品的客户也查看了”的部分甚至永远不会呈现。

您可以通过关闭浏览器中的 JavaScript 来探索此行为。如果您定期抓取,您可能还需要下载 JavaScript 切换器插件。

您可能想要研究的另一种选择是使用浏览器自动化工具,例如 selenium

关于python - 使用 beautifulsoup 抓取 Flipkart 网页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34741394/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com