- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在处理一个基本上如下的过程:
Response
每个人的对象。text
创建一个 BeautifulSoup 对象。根据我的理解,这似乎是 grequests 的理想选择:
GRequests allows you to use Requests with Gevent to make asynchronous HTTP Requests easily.
但是,这两个进程(一个有请求,一个有 grequests)似乎给我带来了不同的结果,grequests 中的一些请求返回 None
而不是响应。
import requests
tickers = [
'A', 'AAL', 'AAP', 'AAPL', 'ABBV', 'ABC', 'ABT', 'ACN', 'ADBE', 'ADI',
'ADM', 'ADP', 'ADS', 'ADSK', 'AEE', 'AEP', 'AES', 'AET', 'AFL', 'AGN',
'AIG', 'AIV', 'AIZ', 'AJG', 'AKAM', 'ALB', 'ALGN', 'ALK', 'ALL', 'ALLE',
]
BASE = 'https://finance.google.com/finance?q={}'
rs = (requests.get(u) for u in [BASE.format(t) for t in tickers])
rs = list(rs)
rs
# [<Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# ...
# <Response [200]>]
# All are okay (status_code == 200)
# Restarted my interpreter and redefined `tickers` and `BASE`
import grequests
rs = (grequests.get(u) for u in [BASE.format(t) for t in tickers])
rs = grequests.map(rs)
rs
# [None,
# <Response [200]>,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# None,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>,
# <Response [200]>]
为什么结果不同?
更新:我可以按如下方式打印异常类型。相关讨论here但我不知道发生了什么。
def exception_handler(request, exception):
print(exception)
rs = grequests.map(rs, exception_handler=exception_handler)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
# ("bad handshake: SysCallError(-1, 'Unexpected EOF')",)
最佳答案
您发送请求的速度太快了。由于 grequests
是一个异步库,所有这些请求几乎都是同时发送的。他们太多了。
你只需要通过grequests.map(rs, size=your_choice)
来限制并发任务,我测试过grequests.map(rs, size=10)
它运作良好。
关于python - 了解请求与 grequests,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46205491/
这是我第一次尝试使用文档和示例代码水平不理想的库,所以请多多包涵。我对 Requests 库有一点经验,但我需要每秒向特定地址发送单独的请求: 无需等待第一个请求完成,处理进来时的个人回应 响应的内容
我正在尝试缩短 urlSet 中的许多 URL。以下代码大部分时间都有效。但有时需要很长时间才能完成。例如,我在 urlSet 中有 2950。 stderr 告诉我 2900 已完成,但 getUr
尽管模块按预期工作,但我每次都会收到以下警告: /usr/local/lib/python3.7/site-packages/grequests.py:21: MonkeyPatchWarning:
我正在使用 grequests 从使用相同 url 但不同参数的网站异步下载数据。 例如, unsent_requests = [] for param in params: # assume par
我最近在工作场所发现了一些使用 grequests library 的内部代码发出它的 HTTP 请求。 但是,当我查看代码时,我注意到程序一次只发送一个请求。例如,考虑以下函数: def run(s
我正在尝试执行大约 100k GET 请求并解析每个请求的响应正文。我认为 grequests 将是一个好方法,但我收到与“打开文件太多”相关的错误。代码如下: import grequests wi
我正在编写一个程序。它从文件中读取 url,然后发出请求。但是处理程序不会被调用。 这是我的代码: import grequests def main(): async_list =[]
我正在处理一个基本上如下的过程: 获取一些 url 列表。 获取Response每个人的对象。 从每个 Response 的 text 创建一个 BeautifulSoup 对象。 从 Beautif
我已经使用python requests 库有一段时间了,最近需要异步发出请求,这意味着我想发送 HTTP 请求,让我的主线程继续执行,并有一个回调请求返回时调用。 当然,我被引导到 greque
我正在使用 grequests 来更快地对网站进行 scape。但是,我还需要登录该网站。 之前(只使用请求)我可以做: headers 是我的 User-Agent。 with requests.S
我想制作多个 requests同时。我找到了可以帮助我实现这一目标的 python 模块!但现在我遇到了一个问题,我不知道如何使用这个库处理每个请求中的简单或基本身份验证。 代码如下: import
我有这个代码 #!/usr/bin/python import grequests urls = [ 'http://google.com', 'http://doesnotexists.tld' ]
关于 grequests 的快速问题,因为它的文档相当稀少。从发送的请求中返回 xml 响应的最佳方法是什么?除了状态代码之外,我无法找到一种方法来获得响应。有人能指出我正确的方向吗? greques
我想传递一个参数来忽略一大组 GET 的 SSL 错误。在 requests 包中,您可以传递 verfiy=false 参数。我没有看到任何类似的请求。如果有更好的方案或方向,我很乐意。 urls
我正在使用 grequests 库传递约 250000 个 url 以从 api 获取数据。 API 的调用限制为每秒 100 次。 如何将请求限制为每秒仅传递 100 个 URL?我将大小参数从 5
我的原始任务:使用 Trello API , 通过 HTTP GET 请求获取数据。如果可能,异步运行请求和处理响应。 API 提供程序使用我通过一些 key 和 token 访问的“https://
我正在使用 grequests python 模块来调用一些 API。我想做两个功能。 单个请求(使用请求模块) 一个多请求(使用grequests模块) 当我在两个不同的文件中使用两个模块时,它运行
这是导致内存使用量不断增加的脚本的精简版本,我看到它在 2 分钟后超过了 600MB: import requests import grequests lines = (grequests.get(
当我尝试使用 pip 在 Ubuntu 上安装 grequests 时: sudo pip install grequests 我收到此错误,但我的 gcc 似乎没问题: In file includ
我看到了这个post关于使用 grequests 发送异步请求。 import grequests urls = [ 'http://www.heroku.com', 'http://
我是一名优秀的程序员,十分优秀!