python - 当客户端连接不稳定时，在 heroku 上运行的 django 中的工作人员卡在岗位上-6ren

python - 当客户端连接不稳定时，在 heroku 上运行的 django 中的工作人员卡在岗位上

转载作者：太空狗更新时间：2023-10-30 01:38:40

我们在 heroku 上运行 django/gunicorn 服务器。我们的大多数用户所在的国家/地区的移动网络不是那么好，因此他们经常遇到不稳定的连接。

我们的大多数请求都是来自移动设备的“原始帖子”，而且似乎即使 POST 请求未完全传输，该请求也已被发送给 gunicorn 工作人员处理。当工作人员尝试处理请求并读取数据时，它只是挂起等待剩余数据。虽然这种行为对于在“流”模式下读取文件/图像数据是有意义的，但在我们的例子中没有意义，因为我们所有的帖子都相对较小，并且可以很容易地被 Web 服务器作为一个整体读取，然后才转发给我们的 gunicorn worker 。

当我们有许多这样的并行请求时，这种提前切换会带来麻烦——因为所有工作人员都可能被阻塞。目前我们通过增加 worker/dynos 的数量来解决这个问题，但成本很高。我找不到任何方法来强制 Web 服务器或 gunicorn 等待，并且只在请求完全传输后才将请求转发给工作人员。

有没有办法让 heroku 的 web 服务器/gunicorn 仅在请求从客户端完全传输(完全由服务器接收)后才将请求传输给 gunicorn worker？

一些示例代码(我们添加了 newrelic 'per-instruction' 跟踪以确保这是导致问题的确切行):

def syncGameState(request):
    transaction = agent.current_transaction()
    with agent.FunctionTrace(transaction, "syncGameState_raw_post_data", 'Python/EndPoint'):
        data = request.raw_post_data
    with agent.FunctionTrace(transaction, "syncGameState_gameStateSyncRequest", 'Python/EndPoint'):
        sync_request = sync_pb2.gameStateSyncRequest()
    with agent.FunctionTrace(transaction, "syncGameState_ParseFromString", 'Python/EndPoint'):
        sync_request.ParseFromString(data)

以下是此示例缓慢请求的 New Relic 测量结果(这是一个包含 7K 数据的 POST)。读取 POST 占用了 99% 的方法时间....

enter image description here