gpt4 book ai didi

Gunicorn 工作线程和线程

转载 作者:行者123 更新时间:2023-12-03 07:25:04 25 4
gpt4 key购买 nike

就 Gunicorn 而言,我知道有各种工作线程类,但对于本次对话,我只关注同步和异步类型。

据我了解...

sync
workers = (2 * cpu) + 1
worker_class = sync

async (gevent)
workers = 1
worker_class = gevent
worker_connections = a value (lets say 2000)

因此(基于 4 核系统)使用同步工作线程,我最多可以并行处理 9 个连接。使用异步,我最多可以拥有 2000 个,但需要注意异步的注意事项。

问题

  • 那么线程适合在哪里呢?我可以将线程添加到同步和异步 worker 类型?
  • 围绕gunicorn worker 的最佳选择是什么?我是否希望将 Gunicorn 放在 Django API 前面,并使用需要并行处理 100 个请求吗?
  • gevent 和同步 worker 类线程安全吗?

最佳答案

让我尝试回答一下。让我们假设一开始我的部署只有一个 Gunicorn Worker。这使我一次只能处理一个请求。我的工作人员的工作只是调用 google.com 并获取查询的搜索结果。现在我想增加我的吞吐量。我有以下选项:

仅保留一个工作线程并增加该工作线程中的线程数量

这是最简单的。由于线程比进程更轻量(内存消耗更少),因此我只保留一个工作线程并向其添加多个线程。 Gunicorn 将确保 master 可以向worker 发送多个请求。由于工作线程是多线程的,因此它能够处理 4 个请求。极好的。现在为什么我需要更多的 worker ?

为了回答这个问题,假设我需要对 google 返回的搜索结果进行一些处理。例如,我可能还想为每个结果查询计算一个素数。现在我正在使我的工作负载计算受限,并且我遇到了 python 全局解释器锁的问题。尽管我有 4 个线程,但每次只有一个线程可以实际处理结果。这意味着要获得真正的并行性能,我需要多个工作人员。

增加工作线程数量,但所有工作线程都是单线程

所以我需要这个的原因是当我需要获得真正的并行处理时。每个工作人员都可以并行调用 google.com、获取结果并进行任何处理。全部并行。极好的。但缺点是进程更重,我的系统可能无法满足不断增加的 worker 完成并行性的需求。所以最好的解决方案是增加worker,并为每个worker添加更多线程。

增加worker数量并且每个worker都是多线程的

我想这不需要进一步解释。

将工作线程类型更改为异步

现在我为什么要这样做?要回答这个问题,请记住,即使是线程也会消耗内存。 gevent 库实现了一些协程(您可以查找的基本结构),它们允许您无需创建线程即可获取线程。因此,如果您将gunicorn 设计为使用worker 类型的gevent,您将获得不必在worker 中创建线程的好处。假设您正在获取线程而无需显式创建它们。

因此,为了回答您的问题,如果您使用 Sync 以外的其他类型的worker_type,则无需增加gunicorn 配置中的线程数。无论如何,你可以做到这一点,但这有点违背了目的。

希望这有帮助。

我也会尝试回答具体问题。

  • 不,异步工作线程类不存在线程选项。这实际上需要通过文档说得更清楚。想知道为什么这没有发生。

  • 这是一个需要更多了解您的具体情况的问题应用。如果处理这100个并行请求只涉及 I/O 类型的操作,例如从数据库中获取、保存、从其他应用程序收集数据,然后您可以利用线程 worker 。但如果情况并非如此并且您想要在 n 核 CPU 上执行,因为任务的计算量非常大界,也许就像计算素数一样,你需要利用同步工作人员。异步的原因略有不同。使用异步,您需要确保您的处理不受计算限制,这意味着您将无法使用多个核心。您获得的优势是多个线程占用的内存不会在那里。但你还有其他问题,比如非猴子补丁图书馆。仅当线程工作人员不满足时才转移到异步您的要求。

  • 如果你想要绝对同步,非线程工作人员是最好的选择库中的线程安全。

关于Gunicorn 工作线程和线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38425620/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com