Scrapy FormRequest 返回 400 错误代码-6ren

Scrapy FormRequest 返回 400 错误代码

转载作者：行者123 更新时间：2023-12-01 06:26:32

27

4

我正在尝试抓取以下网站，其中分页是通过 AJAX 请求进行的。
http://studiegids.uva.nl/xmlpages/page/2014-2015/zoek-vak

我正在发送 FormRequest 以访问不同的页面，但是出现以下错误。
重试 http://studiegids.uva.nl/xmlpages/plspub/uva_search.courses_pls>(失败 1 次):400 错误请求

无法理解有什么问题？以下是代码。

class Spider(BaseSpider):
name = "zoek"
allowed_domains = ["studiegids.uva.nl"]
start_urls = ["http://studiegids.uva.nl/xmlpages/page/2014-2015/zoek-vak"]

def parse(self, response):
    base_url = "http://studiegids.uva.nl/xmlpages/page/2014-2015/zoek-vak"
    for i in range(1, 10):
        data = {'p_fetch_size': unicode(20),
                'p_page:': unicode(i),
                'p_searchpagetype': u'courses',
                'p_site_lang': u'nl',
                'p_strip': u'/2014-2015',
                'p_ctxparam': u'/xmlpages/page/2014-2015/',
                'p_rsrcpath':u'/xmlpages/resources/TXP/studiegidswebsite/'}

        yield FormRequest.from_response(response,
                                        formdata=data,
                                        callback=self.fetch_details,
                                        dont_click=True)

        # yield FormRequest(base_url,
        #                   formdata=data,
        #                   callback=self.fetch_details)

def fetch_details(self, response):
    # print response.body
    hxs = HtmlXPathSelector(response)
    item = ZoekItem()
    Studiegidsnummer = hxs.select("//div[@class=item-info']//tr[1]/td[2]/p/text()")
    Studielast = hxs.select("//div[@class=item-info']//tr[2]/td[2]/p/text()")
    Voertaal = hxs.select("//div[@class=item-info']//tr[3]/td[2]/p/text()")
    Ingangseis = hxs.select("//div[@class=item-info']//tr[4]/td[2]/p/text()")
    Studiejaar = hxs.select("//div[@class=item-info']//tr[5]/td[2]/p/text()")
    Onderwijsinstituut = hxs.select("//div[@class=item-info']//tr[6]/td[2]/p/text()")


    for i in range(20):
        item['Studiegidsnummer'] = Studiegidsnummer
        item['Studielast'] = Studielast
        item['Voertaal'] = Voertaal
        yield item

最佳答案

还尝试使用 Firebug 检查标题。

关于Scrapy FormRequest 返回 400 错误代码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27937566/

27

4

0

文章推荐： asp.net - 带有 OData v4 的 Web Api 在 $select 上抛出异常

文章推荐： jquery - 在月 View (完整日历)中显示事件总数？

文章推荐： excel - 从网页中抓取表格

文章推荐： apache-spark - 如何在 Spark 中配置 spark.io.compression.codec=lzf

python - 使用 FormRequest.from_response() 模拟用户登录 - FormRequest 未定义
不确定我是否有 Scrapy 或 Twisted 或 ???通过 easy_install 运行 Python 2.7 32 位和最新的 scrapy/依赖项尝试模拟 POST 请求登录并使其正常工
php - FormRequest 中的条件语句
在我的 Controller 中，我在验证之前有条件语句 if ($request->department == 5) { $this->validate($request, [ //
laravel - 如何在从 FormRequest 扩展的类中验证具有相同名称的多个输入
我是 Laravel 新手。我想知道如何验证具有相同名称的多个输入。我有一个 POST 请求的验证规则，但是虽然我有所有需要的值，但验证失败。我注意到键名与用户输入的键名不同，所以我认为这是导致
Laravel 中 FormRequest 的验证消息
我有一个如下所示的 FormRequest 类 'image|mimes:jpg,png,jpeg,|max:2048', ]; } } 如何在此处获取验证消息？就像
python - Scrapy:在下载器中间件中返回 FormRequest
我正在抓取的网站有时会重定向到带有我想在下载器中间件中处理的表单的页面。这个想法是每次发生这种重定向时，它都会自动提交表单并检索结果。我的中间件看起来像: from scrapy import For
php - Laravel FormRequest 获取输入值
我尝试使用 FormRequest: class RegistrationForm extends FormRequest { public function authorize()
validation - 如何从 FormRequest 类方法中访问当前经过身份验证的用户
我有一个带有两个功能的 User 模型来检查用户的性别。对于特定的表单，我创建了一个 FormRequest目的。现在，我需要设置一些特定于用户性别的验证规则，即对于男性用户有一组规则，对于女性用户有
laravel - 使用 formRequest 将错误添加到验证错误
我正在尝试弄清楚如何在使用验证槽请求时将错误消息添加到由 Illuminate\Support\MessageBag 生成的默认 $error 中。我在 google 和 laravel 文档上进行
python - 如何使用 FormRequest 发布具有多个同名输入的表单？
我正在用 scrapy 编写一个网络爬虫来处理表单。问题是我遇到了一个包含大量同名输入的表单。标签如下: 唯一区分它们的是 ID 属性。我想用一些数字填充 ID='crn_id1' 的人。然而，
Python Scrapy FormRequest 回调没有发生
我正在使用 Scrapy 编写一个 python 脚本来抓取具有登录页面的网站。我正在尝试使用 Scrapy 中的 FormRequest.from_response 填写表单，但没有成功，不知道为什
python - 重复请求发布到 scrapy FormRequest
我正在尝试学习 scrapy FormRequest 如何在网站上工作，我有以下 scrapy 代码: import scrapy import json from scrapy.utils.resp
python - 为什么这个 FormRequest 没有让我登录？
这里是完整的 Python 新手，所以我可能会问一些非常明显的问题，但我已经搜索过这个网站、Scrapy 文档和 Google，我完全陷入了这个问题。本质上，我想使用 Scrapy 的 FormRe
php - 如何在我的 FormRequest 中添加自定义验证器？
我有一个规则 (foobar)，它不是 Laravel 内置的，我想在我的扩展 FormRequest 中使用。如何为该特定规则创建自定义验证器？ public function rules() {
php - 动态 FormRequest 验证 (Laravel)
是否可以在我的函数中创建动态 FormRequest 验证？请参阅下面的示例代码。 public function store(Request $request) { Model::creat
python - Scrapy FormRequest 参数不起作用，而是显示所有结果
我正在抓取此网页 https://researchgrant.gov.sg/eservices/advanced-search/?keyword=&source=sharepoint&type=pro
javascript - Scrapy FormRequest.from_response 错误
我正在尝试从“https://pagesjaunes.fr ”中抓取数据。我为了从pagesjaunes中抓取数据:电子邮件、地址等我首先要在中提交数据当我在网络 chrome 调试器中搜索以查看
python - 请求模块可以工作，但 FormRequest 不能
我正在尝试学习Scrapy。我尝试在 Scrapy 中复制以下发布请求，但没有成功。我也尝试了 scrapy.Request(method='POST') 但它也不起作用。 import reques
routing - 带有路由参数的 FormRequest (Laravel 5)
我目前正在研究 FormRequest 对象，以使用它对传入数据执行身份验证和验证。但是，在使用模型注入(inject)时我无法让它工作。路由.php: Route::model('post', '
Scrapy FormRequest 返回 400 错误代码
我正在尝试抓取以下网站，其中分页是通过 AJAX 请求进行的。 http://studiegids.uva.nl/xmlpages/page/2014-2015/zoek-vak 我正在发送 Form
python - Scrapy FormRequest.from_response() 方法
我正在尝试解析 this使用 Scrapy 的页面为了显示带有价格的隐藏文本，我在字段中输入了任何邮政编码或随机数字: 对于带有价格的响应 url，我尝试使用 yse FormRequest.fro

首页

博学

6Ren·AI

商城

Scrapy FormRequest 返回 400 错误代码