gpt4 book ai didi

javascript - 在 Scrapy 响应中执行内联 JavaScript

转载 作者:行者123 更新时间:2023-11-28 21:41:33 26 4
gpt4 key购买 nike

我正在尝试使用 Scrapy 登录网站,但收到的响应是一个仅包含内联 JavaScript 的 HTML 文档。 JS 重定向到我想从中抓取数据的页面。但是 Scrapy 不执行 JS,因此不会路由到我想要的页面。

我使用以下代码提交所需的登录表单:

    def parse(self, response):
request_id = response.css('input[name="request_id"]::attr(value)').extract_first()
data = {
'userid_placeholder': self.login_user,
'foilautofill': '',
'password': self.login_pass,
'request_id': request_id,
'username': self.login_user[1:]
}
yield scrapy.FormRequest(url='https://www1.up.ac.za/oam/server/auth_cred_submit', formdata=data,
callback=self.print_p)

print_p回调函数如下:

def print_p(self, response):
print(response.text)

我查看了 scrapy-splash,但我找不到在响应中使用 scrapy-splash 执行 JS 的方法。

最佳答案

我建议使用 Splash作为渲染服务。就个人而言,我发现它比 Selenium 更可靠。使用 scripts ,您可以指示它与页面进行交互。

关于javascript - 在 Scrapy 响应中执行内联 JavaScript,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44696376/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com