gpt4 book ai didi

python - 单击 Scrapy-Splash 中的按钮

转载 作者:太空宇宙 更新时间:2023-11-03 13:06:45 26 4
gpt4 key购买 nike

我正在编写一个 scrapy-splash 程序,我需要点击网页上的显示按钮,如下图所示,以显示第 10 版的数据,这样我就可以抓取它了。我有我在下面尝试过的代码,但它不起作用。只有单击显示按钮才能访问我需要的信息。 更新:仍在为此苦苦挣扎,我不得不相信有办法做到这一点。我不想抓取 JSON,因为这对网站所有者来说可能是一个危险信号。

import scrapy
from ..items import NameItem

class LoginSpider(scrapy.Spider):
name = "LoginSpider"
start_urls = ["http://www.starcitygames.com/buylist/"]

def parse(self, response):

return scrapy.FormRequest.from_response(
response,
formcss='#existing_users form',
formdata={'ex_usr_email': 'email123@example.com', 'ex_usr_pass': 'password123'},
callback=self.after_login
)


def after_login(self, response):
item = NameItem()
display_button= response.xpath('//a[contains(., "- Display>>")]/@href').get()
response.follow(display_button, self.parse)
item["Name"] = response.css("div.bl-result-title::text").get()
return item

Snapshot of Webpage HTML Code

最佳答案

您的代码无法运行,因为没有 anchor 元素和 href 属性。单击该按钮将向 http://www.starcitygames.com/buylist/search?search-type=category&id=5061 发送一个 XMLHttpRequest 并找到您想要的数据在 JSON 响应中。

  1. 要检查请求 URL 和响应,请打开 Dev Tools -> Network -> XHR,然后单击 Display
  2. Headers 选项卡中,您可以找到请求 URL,在 PreviewResponse 选项卡中,您可以检查 JSON。
  3. 如您所见,您需要一个类别 id 来构建请求 URL。您可以通过解析使用此 XPath //script[contains(., "categories")]
  4. 找到的 script 元素找到它
  5. 然后您可以将您的请求从蜘蛛发送到 http://www.starcitygames.com/buylist/search?search-type=category&id=5061 并获取您想要的数据。<
$ curl 'http://www.starcitygames.com/buylist/search?search-type=category&id=5061'
{"ok":true,"search":"10th Edition","results":[[{"id":"46269","name":"Abundance","subtitle":null,"condition":"NM\/M","foil":true,"is_parent":false,"language":"English","price":"20.000","rarity":"Rare","image":"cardscans\/MTG\/10E\/en\/foil\/Abundance.jpg"},{"id":"176986","name":"Abundance","subtitle":null,"condition":"PL","foil":true,"is_parent":false,"language":"English","price":"12.000","rarity":"Rare","image":"cardscans\/MTG\/10E\/en\/foil\/Abundance.jpg"}....

如您所见,您甚至不需要登录网站或 Splash

关于python - 单击 Scrapy-Splash 中的按钮,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56706272/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com