gpt4 book ai didi

javascript - Scrapy splash 响应不会返回完整的 html

转载 作者:行者123 更新时间:2023-11-30 19:40:36 50 4
gpt4 key购买 nike

我正在尝试抓取此链接 https://www.myntra.com/women-kurtas-kurtis-suits .但是当尝试通过 splash http API 呈现它时。我在下面得到了部分呈现的结果 enter image description here

我在这里遗漏了什么吗?

这是实际的页面。

enter image description here

最佳答案

如果您要抓取产品,为什么不使用默认返回的非 JS 呈现的 HTML?您会发现其中包含产品详细信息的 JSON 对象。以下是您发布的网页中的示例:

    <script type="application/ld+json"> {"@context":"https://schema.org","@type":"Product","name":"AKS Women Blue & Grey Printed Kurta with Palazzos","image":"http://assets.myntassets.com/assets/images/8076903/2018/12/8/fb0cf882-a473-4aae-86c2-edf912b70b6e1544251004970-AKS-Women-Kurta-Sets-2261544251003921-1.jpg","description":"Women Printed Kurta with Palazzos","brand":{"@type":"Thing"},"offers":{"@type":"Offer","priceCurrency":"INR","price":989},"AggregateRating":{"@type":"AggregateRating","itemReviewed":"AKS Women Blue & Grey Printed Kurta with Palazzos","ratingCount":0,"reviewCount":""}}</script>

使用 JSON Python 库,您可以提取数据并根据需要使用它。

关于javascript - Scrapy splash 响应不会返回完整的 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55447396/

50 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com