python - httplib.BadStatusLine : ''-6ren

python - httplib.BadStatusLine : ''

转载作者：太空狗更新时间：2023-10-29 16:55:01

44

4

一如既往，我经常遇到问题，我已经彻底搜索了当前问题的答案，但发现自己一头雾水。以下是我搜索过的一些地方:- How to fix httplib.BadStatusLine exception?- Python httplib2 Handling Exceptions- python http status code

我的问题如下。我创建了一个蜘蛛，想抓取不同的 url。当我独立抓取每个网址时，一切正常。但是，当我尝试抓取两者时，出现以下错误:httplib.BadStatusLine: ''

我遵循了我阅读的一些建议(参见上面提到的链接)并且可以打印每个请求的 response.status 工作，但是 response.url 不打印并且抛出错误。 (我只打印这两个语句来尝试识别错误的来源)。

我希望这是清楚的。

我正在使用 scrapy 和 selenium

class PeoplePage(Spider):
    name = "peopleProfile"
    allowed_domains = ["blah.com"]
    handle_httpstatus_list = [200, 404]
    start_urls = [
        "url1",
        "url2"
    ]

    def __init__(self):
        self.driver = webdriver.Firefox()

    def parse(self, response):
        print response.status
        print '???????????????????????????????????'
        if response.status == 200:
            self.driver.implicitly_wait(5)
            self.driver.get(response.url)
            print response.url
            print '!!!!!!!!!!!!!!!!!!!!'

            # DO STUFF

        self.driver.close()

最佳答案

基于 Python Doc , httplib.BadStatusLine 如果服务器响应我们不理解的 HTTP 状态代码，则引发。您可以尝试传递此异常。如果您要调用多个 url，则不应关闭驱动程序。

试试这个:

def parse(self, response):
    try:
        print response.status
        print '???????????????????????????????????'
        if response.status == 200:
            self.driver.implicitly_wait(5)
            self.driver.get(response.url)
            print response.url
            print '!!!!!!!!!!!!!!!!!!!!'

            # DO STUFF
    except httplib.BadStatusLine:
        pass

关于python - httplib.BadStatusLine : '' ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27619258/

44

4

0

文章推荐： Python Proportion 测试类似于 R 中的 prop.test

文章推荐： python - Intellij/Pycharm 无法调试 Python 模块

文章推荐： Angular 4 : get error message in subscribe

python - Django/httplib : transmitting request. raw_post_data 与 httplib
“AAaarg”!请帮忙!!! 这是我正在尝试做的... 我有一个 Django 站点 site1，它需要访问另一个服务 site2 的 API。然而，为了做到这一点，site1 需要使用它自己的登录
httplib - httplib python的POST方法报错 "socket.gaierror: [Errno -2] Name or service not known"
以下代码引发错误“socket.gaierror: [Errno -2] Name or service not known”。 import httplib, urllib attrs = urll
python - httplib 未获取所有重定向代码
我正在尝试获取似乎重定向不止一次的页面的最终 URL。在您的浏览器中尝试这个示例 URL，并将其与我的代码片段底部的最终 URL 进行比较: Link that redirects more than
python httplib 到本地主机的超时
我有一个在端口 6868 上运行的本地服务器。从技术上讲，它是使用 Express 构建的由 Node.js 驱动的微型站点。它实际上有一个“/push” Controller 读取一些数据并写入控制
Python httplib.HTTPS连接和密码
我使用带有私钥的httplib.HTTPSConnection: h = httplib.HTTPSConnection(url, key_file='../cert/priv.pem', cert_
Python httplib 禁用证书验证
我有以下代码要使用: def createCon(host,auth): con = httplib.HTTPSConnection(host) return con def _rea
python - Httplib 无法处理特定域
我有一个脚本，它使用 Python 中的 httplib 获取互联网上很多页面的 HTTP header 。我的问题是关于 specific domain (可能还有其他人)，httplib 引发异
python httplib 名称或服务未知
我正在尝试使用 httplib 将信用卡信息发送到 authorize.net。当我尝试发布请求时，我得到以下回溯: File "./lib/cgi_app.py", line 139, in run
python - 通过代理隧道化 httplib
我正在尝试弄清楚如何通过代理将数据发送到服务器。我希望这可以通过 tor 实现，但是因为 tor 使用 SOCKS，所以使用 httplib 显然不可能(如果我错了请纠正我) 这是我现在拥有的 imp
Python httplib ResponseNotReady
我正在使用 python 为 elgg 编写一个 REST 客户端，即使请求成功，我也会得到以下响应: Traceback (most recent call last): File "testc
python - python httplib 的各种超时
我正在实现一个从各种服务器获取网页的小服务。我需要能够配置不同类型的超时。我尝试过使用套接字的 settimeout 方法，但它并不完全符合我的要求。这是问题所在。我需要指定初始 DNS 查找的超时
python - httplib 303 查看其他响应
我正在使用 httplib 向服务器发布帖子。我正在拿回 303 See Other。我如何查看重定向消息“303 See Other”并没有真正帮助。谢谢 conn1 = httplib.HTTP
python - httplib - CSRF token
问题是这样的: 我有一个 Django 网站。我正在尝试使用 httplib 向站点发送 POST 请求。当我尝试发送 POST 请求时，Django 需要 CSRF token 。如何才能毫无
javascript - httplib(python)可以与页面及其javascript交互吗？
我想编写一个 python 脚本，它将请求 reddit 帖子 url，转到页面，使用指定帐户登录并为帖子点赞和注销。 A) 这可以用 python 完成吗？ B) 我该怎么做？如果您可以提供很棒的代
带代理的 Python httplib.HTTPSConnection
我想使用 HTTPS 协议(protocol)从 python 的 httplib 库发送 Get 请求。我已经浏览了多个答案，建议如何在使用 http 协议(protocol)时执行此操作，但它们
python - 泡沫错误 : BadStatusLine in httplib
我正在使用 suds 0.3.6。创建 suds 客户端时，随机出现错误: httplib.py，_read_status()，第 355 行，类 httplib.BadStatusLine' 这是用
python - 将服务器证书验证添加到 httplib.HTTPSConnection
我发现 httplib.HTTPSConnection 不执行自动服务器证书检查。据我了解的问题，我需要手动添加该功能，例如通过按照描述对此类进行子类化 here . 由于我使用的是 Python2.
python - 如何将 httplib 调试器信息设置为记录器调试级别
默认情况下，httplib 调试发送、 header 和回复信息作为 logger.info 返回，如何将发送、 header 和重播显示为调试信息的一部分？ import requests imp
Python httplib [多个请求] - 我可以保持连接打开多长时间？
我想通过 HTTP GET 请求将数据发送到我的服务器，每 1-2 秒一次。我应该每次都创建一个新连接，还是应该保持连接打开并继续通过同一连接发送请求？如果我采用后一种方法，httplib 会保持连
python httplib httpexception 错误代码
httplib.HTTPException 是否有错误代码？如果是这样，我如何从异常实例中获取它们？感谢您的帮助。最佳答案 httplib 模块不使用异常来传达 HTTP 响应，只是真正的错误(无效

首页

博学

6Ren·AI

商城

python - httplib.BadStatusLine : ''