python - 如何使用 asyncio/aiohttp 确定最佳缓冲区大小-6ren

python - 如何使用 asyncio/aiohttp 确定最佳缓冲区大小

转载作者：行者123 更新时间：2023-12-05 02:01:49

26

4

在 python 中使用 asyncio 时，我们如何确定 read() 的最佳参数？ 12 个字节？ 100 字节？

async with self._session.get(url, headers=headers) as response:
    chunk_size = 12
    result = ''

    while True:
       chunk = await response.content.read(chunk_size)
          if not chunk:
              break
          elif isinstance(chunk, (bytes, bytearray)):
              data = chunk.decode('utf8')
               result += data

最佳答案

How do we decide the optimal parameter for read() when working with asyncio in python? 12 bytes? 100 bytes?

您可以安全地选择一个比这个大得多的数字。如果数字太小(例如只有 1)，您的循环将包含对 StreamReader.read 的多次调用，每个调用都会带来固定的开销 - 它必须检查缓冲区中是否有内容，然后返回其中的一部分并更新剩余的缓冲区，或者等待新的东西到达。另一方面，如果请求的大小过大，理论上可能需要不必要的大分配。但是由于允许 StreamReader.read 返回比指定的少的数据，它永远不会返回大于内部缓冲区的 block (64 KiB by default )，所以这不是问题。

总结:任何大于 1024 左右的数字都可以，因为它足够大，可以避免不必要的函数调用次数。在大多数情况下，请求超过 65536 与请求 65536 相同。当我不关心绝对最佳性能时，我倾向于请求 1024 字节(调试时更小的 block 更容易在眼睛上)，而更大的值，如 16384，当我做。数字不一定是 2 的幂，顺便说一句，这只是低级语言的约定。

专门处理aiohttp流时，可以调用readany ，一种只返回任何可用数据的方法，如果没有可用数据，则等待一些数据到达并返回它。如果您正在处理 aiohttp 流，这可能是最佳选择，因为它只为您提供来自内部缓冲区的数据，而不必担心其大小。

关于python - 如何使用 asyncio/aiohttp 确定最佳缓冲区大小，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66284917/

26

4

0

文章推荐： r - 如何在嵌套列表中使用 for 循环？

文章推荐： hash - 在合并语句中使用散列键作为比较列

python - aiohttp 与 aiohttp-devtools 热重载
我想要一个类似于 django runserver 所做的重新加载。如果我更改 python 文件，我希望应用程序重新加载。我已经安装了 aiohttp-devtools 并使用 adev runs
python - Aiohttp 路由 (aiohttp.web.RouteTableDef)
我在使用 RouteTableDef 时遇到问题。有一些项目的路由结构如下: 1) 有文件route.py。路线.py from aiohttp import web routes = web.R
python - 使用 aiohttp.ClientSession() 发出请求时如何为 aiohttp.client 设置日志记录？
我有一些代码对某些 API 进行请求序列。我想为所有人设置通用日志记录，我该如何设置？假设我的代码是这样的 import aiohttp import asyncio async def fetch
python - aiohttp:如何从 requests.get 检索 aiohttp 服务器中的数据(正文)
您能否就以下方面提出建议？在 localhost:8900 上有 aiohttp 服务器在运行当我从 python 发出类似(使用 python2 模块请求)的请求时 requests.get("
python-3.x - aiohttp client_exception ServerDisconnectedError - 这是 API 服务器的问题还是 aiohttp 或我的代码？
每当我对使用 asyncio 和 aiohttp 访问的 API 执行超过 200 个请求时，我都会收到 aiohttp client_exception.ServerDisconnectedErro
python - aiohttp 优于 pycurl multi，因为 python 有 gil，切换到 aiohttp 可以获得什么好处？
在我正在开发的爬虫中。它使用 pycurl multi 发出请求。如果我改用aiohttp，我可以期待什么样的效率提升？怀疑让我怀疑潜在的改进，因为 python 有 GIL。大部分时间都花在等待
python - 问题 azure 测试聊天机器人 "Error while finding module specification for ' aiohttp.web' (ModuleNotFoundError : No module named 'aiohttp' )
我在尝试使用 azure 测试聊天机器人时遇到一些问题: 我使用 github actions 在 azure web 应用程序上部署了我的机器人，一切都很顺利。但是当我尝试测试我的聊天机器人时，没有
python - 问题 azure 测试聊天机器人 "Error while finding module specification for ' aiohttp.web' (ModuleNotFoundError : No module named 'aiohttp' )
我在尝试使用 azure 测试聊天机器人时遇到一些问题: 我使用 github actions 在 azure web 应用程序上部署了我的机器人，一切都很顺利。但是当我尝试测试我的聊天机器人时，没有
python - aiohttp 帖子的当前上传步骤
我想知道如何从 aiohttp post 方法获取当前的上传步骤。通常我会使用 get 方法在循环中拉取当前步骤，但如果主机不响应当前上传步骤，这将不起作用。那么有可能得到当前步骤吗？诸如“从 xx%
python - aiohttp/从上下文管理器中获取响应对象
我目前正在用 aiohttp 做我的第一个“婴儿学步” (来自 requests 模块)。我尝试稍微简化请求，这样我就不必在主模块中为每个请求使用上下文管理器。因此我尝试了这个: async de
python - 最大化并行请求数 (aiohttp)
tl;dr:如何最大化可以并行发送的 http 请求数量？我正在使用 aiohttp 库从多个网址获取数据。我正在测试它的性能，并且观察到该过程中的某个地方存在瓶颈，一次运行更多的网址并没有帮助。
python - aiohttp:获取当前正在运行的应用程序
目前我正在执行以下操作来获取当前正在运行的应用程序 async def handler(request): app = request.app 是否有其他方法来获取当前正在运行的应用程序？考虑
python - Aiohttp 不执行任何请求
首先是代码: import random import asyncio from aiohttp import ClientSession import csv headers =[] def ext
python - aiohttp 隐式地使我的方法发挥作用
我的 aiohttp 中间件获取函数作为参数，而不是已传递给路由的绑定(bind)方法。如何解释这种行为？如何避免这种情况？ class AsyncHttpServer: def __init
python - aiohttp 处理程序中的后台任务
我正在尝试在 aiohttp 处理程序中启动后台长时间任务: from aiohttp import web import time import asyncio async def one(requ
python aiohttp 进入现有的事件循环
我正在测试 aiohttp 和 asyncio。我希望相同的事件循环具有套接字、http 服务器、http 客户端。我正在使用此示例代码: @routes.get('/') async def he
python - aiohttp 错误无效常量字符串
#!/usr/bin/env python3.5 import asyncio import aiohttp url = "http://eniig.dk" async def main():
python - aiohttp:装饰器序列链
考虑以下代码: from aiohttp_mako import template def authorize(): def wrapper(func): @asyncio.c
python - aiohttp:按域限制每秒请求数
我正在编写一个网络爬虫，它为许多不同的域运行并行提取。我想限制每秒向每个单独的域发出的请求数，但我不关心打开的连接总数或每秒的总请求数跨越所有领域。我想最大限度地提高打开的连接数和每秒请求数，同时限
python - aiohttp:如何将sub_app添加到sub_app？
我需要将 sub_app 添加到 sub_app。这是我的代码 app = web.Application() subapp = web.Application() subapp.router.add

首页

博学

6Ren·AI

商城

python - 如何使用 asyncio/aiohttp 确定最佳缓冲区大小