gpt4 book ai didi

python - 错误 R14(超出内存配额)导致在 Heroku 中使用 Selenium 与 Python、FastAPI 和 Celery 时出现 TimeoutException

转载 作者:行者123 更新时间:2023-12-02 15:55:01 25 4
gpt4 key购买 nike

我构建了一个从页面收集数据、格式化并将其添加到数据库的抓取工具。然后它使用抓取的数据来构建模型,但它抓取的一个值除外。一切都包装在 Celery 中,以便任务在后台运行。

@router.post("/run/{id}")
async def create(id: str):
wallet_reputation.delay(id)

return {"Status": "Task successfully add to execute"}

上面的端点工作正常,一切正常。在上述端点中添加的 ID 值是唯一的,大约有 100 个这样的值。为了自动为每个 ID 构建模型,我制作了这样一个端点以不时调用它(抓取数据更改,因此我需要更新我的模型)。

@router.post("/run")
async def create_all():
for address in all_addresses_generator():
wallet_reputation.delay(address)

return {"Status": "Tasks successfully add to execute"}

我收到那个错误

2022-03-26T15:25:52.051854+00:00 heroku[worker.1]: Process running mem=543M(104.1%)
2022-03-26T15:25:52.073256+00:00 heroku[worker.1]: Error R14 (Memory quota exceeded)
2022-03-26T15:26:02.875701+00:00 app[worker.1]: [2022-03-26 15:26:02,871: ERROR/ForkPoolWorker-8] Task walletReputation[2cca3c3e-8c58-4983-bbae-e55e52f33c1a] raised unexpected: TimeoutException('', None, ['#0 0x556bcd4bc7d3 <unknown>', '#1 0x556bcd218688 <unknown>', '#2 0x556bcd24ec21 <unknown>', '#3 0x556bcd24ede1 <unknown>', '#4 0x556bcd281d74 <unknown>', '#5 0x556bcd26c6dd <unknown>', '#6 0x556bcd27fa0c <unknown>', '#7 0x556bcd26c5a3 <unknown>', '#8 0x556bcd241ddc <unknown>', '#9 0x556bcd242de5 <unknown>', '#10 0x556bcd4ed49d <unknown>', '#11 0x556bcd50660c <unknown>', '#12 0x556bcd4ef205 <unknown>', '#13 0x556bcd506ee5 <unknown>', '#14 0x556bcd4e3070 <unknown>', '#15 0x556bcd522488 <unknown>', '#16 0x556bcd52260c <unknown>', '#17 0x556bcd53bc6d <unknown>', '#18 0x7f8e32957609 <unknown>', ''])
2022-03-26T15:26:02.875723+00:00 app[worker.1]: Traceback (most recent call last):
2022-03-26T15:26:02.875724+00:00 app[worker.1]: File "/app/.heroku/python/lib/python3.9/site-packages/celery/app/trace.py", line 451, in trace_task
2022-03-26T15:26:02.875724+00:00 app[worker.1]: R = retval = fun(*args, **kwargs)
2022-03-26T15:26:02.875724+00:00 app[worker.1]: File "/app/.heroku/python/lib/python3.9/site-packages/celery/app/trace.py", line 734, in __protected_call__
2022-03-26T15:26:02.875725+00:00 app[worker.1]: return self.run(*args, **kwargs)
2022-03-26T15:26:02.875725+00:00 app[worker.1]: File "/app/tasks.py", line 40, in wallet_reputation
2022-03-26T15:26:02.875725+00:00 app[worker.1]: WalletReputation(id).add_reputation_to_db()
2022-03-26T15:26:02.875727+00:00 app[worker.1]: File "/app/agents/walletReputation.py", line 261, in add_reputation_to_db
2022-03-26T15:26:02.875727+00:00 app[worker.1]: nc_balance=self.nc_balance(),
2022-03-26T15:26:02.875727+00:00 app[worker.1]: File "/app/agents/walletReputation.py", line 162, in nc_balance
2022-03-26T15:26:02.875727+00:00 app[worker.1]: WebDriverWait(self.driver, 20)
2022-03-26T15:26:02.875727+00:00 app[worker.1]: File "/app/.heroku/python/lib/python3.9/site-packages/selenium/webdriver/support/wait.py", line 89, in until
2022-03-26T15:26:02.875728+00:00 app[worker.1]: raise TimeoutException(message, screen, stacktrace)
2022-03-26T15:26:02.875728+00:00 app[worker.1]: selenium.common.exceptions.TimeoutException: Message:
2022-03-26T15:26:02.875729+00:00 app[worker.1]: Stacktrace:
2022-03-26T15:26:02.875729+00:00 app[worker.1]: #0 0x556bcd4bc7d3 <unknown>
2022-03-26T15:26:02.875729+00:00 app[worker.1]: #1 0x556bcd218688 <unknown>
2022-03-26T15:26:02.875730+00:00 app[worker.1]: #2 0x556bcd24ec21 <unknown>
2022-03-26T15:26:02.875730+00:00 app[worker.1]: #3 0x556bcd24ede1 <unknown>
2022-03-26T15:26:02.875730+00:00 app[worker.1]: #4 0x556bcd281d74 <unknown>
2022-03-26T15:26:02.875730+00:00 app[worker.1]: #5 0x556bcd26c6dd <unknown>
2022-03-26T15:26:02.875730+00:00 app[worker.1]: #6 0x556bcd27fa0c <unknown>
2022-03-26T15:26:02.875731+00:00 app[worker.1]: #7 0x556bcd26c5a3 <unknown>
2022-03-26T15:26:02.875731+00:00 app[worker.1]: #8 0x556bcd241ddc <unknown>
2022-03-26T15:26:02.875731+00:00 app[worker.1]: #9 0x556bcd242de5 <unknown>
2022-03-26T15:26:02.875731+00:00 app[worker.1]: #10 0x556bcd4ed49d <unknown>
2022-03-26T15:26:02.875732+00:00 app[worker.1]: #11 0x556bcd50660c <unknown>
2022-03-26T15:26:02.875732+00:00 app[worker.1]: #12 0x556bcd4ef205 <unknown>
2022-03-26T15:26:02.875732+00:00 app[worker.1]: #13 0x556bcd506ee5 <unknown>
2022-03-26T15:26:02.875732+00:00 app[worker.1]: #14 0x556bcd4e3070 <unknown>
2022-03-26T15:26:02.875733+00:00 app[worker.1]: #15 0x556bcd522488 <unknown>
2022-03-26T15:26:02.875733+00:00 app[worker.1]: #16 0x556bcd52260c <unknown>
2022-03-26T15:26:02.875733+00:00 app[worker.1]: #17 0x556bcd53bc6d <unknown>
2022-03-26T15:26:02.875733+00:00 app[worker.1]: #18 0x7f8e32957609 <unknown>

我不明白,如果前面在 Celery 中执行相同任务的端点正常工作,为什么会突然出现错误。下面,我粘贴生成器和类方法的代码,在上面弹出错误。

def all_addresses_generator():
for row in session.query(DbNcTransaction).all():
yield row.to
def nc_balance(self):
base_url = "https://polygonscan.com/token/0x64a795562b02830ea4e43992e761c96d208fc58d?a="
self.driver.get(base_url + self.address)

nc_balance = (
WebDriverWait(self.driver, 20)
.until(
EC.presence_of_element_located(
(By.CSS_SELECTOR, "#ContentPlaceHolder1_divFilteredHolderBalance")
)
)
.text
)

nc_balance = nc_balance.split()[1]
nc_balance = round(float(nc_balance.replace(",", "")), 2)

return nc_balance

我该如何处理?

最佳答案

这个错误信息...

2022-03-26T15:25:52.051854+00:00 heroku[worker.1]: Process running mem=543M(104.1%)
2022-03-26T15:25:52.073256+00:00 heroku[worker.1]: Error R14 (Memory quota exceeded)
2022-03-26T15:26:02.875701+00:00 app[worker.1]: [2022-03-26 15:26:02,871: ERROR/ForkPoolWorker-8] Task walletReputation[2cca3c3e-8c58-4983-bbae-e55e52f33c1a] raised unexpected: TimeoutException

...暗示 TimeoutException 被引发,因为初始化 ForkPoolWorker-8 时出现错误,因为您的程序超出了内存配额。


深入探讨

这是 Out of Memory 错误的典型示例,其中内存使用量已超过最大级别。

Process running mem=543M(104.1%)

现在在 543M 的使用期间,内存使用量是 104.1% 并且大概根据 Dyno memory specs 你必须使用:

free, hobby and standard-1x have 512 MB


测功机

Heroku Platform 使用容器模型运行和扩展所有 Heroku 应用程序,容器称为 dynos。 Dynos 是隔离的、虚拟化的 Linux 容器,旨在根据用户指定的命令执行代码。应用可以根据其资源需求扩展到任意指定数量的测功机。


Error R14 (Memory quota exceeded)

有时,dyno 可能需要超过其分配配额的内存。在这些异常情况下,dyno 将分页以交换空间以继续运行,这有时可能会导致进程性能下降。这种现象可以开始生成 R14 错误,该错误由总内存交换、rss 和缓存计算如下:

2011-05-03T17:40:10+00:00 app[worker.1]: Working
2011-05-03T17:40:10+00:00 heroku[worker.1]: Process running mem=1028MB(103.3%)
2011-05-03T17:40:11+00:00 heroku[worker.1]: Error R14 (Memory quota exceeded)
2011-05-03T17:41:52+00:00 app[worker.1]: Working

解决R14内存错误

在这些情况下,您可能希望您的应用程序使用更少的内存,并且您可能需要调整以下提到的因素之一:

  • 线程数
  • 尽可能大的要求
  • 传入请求的分布
  • 减少线程数以减少内存需求(但这可能会降低吞吐量)
  • 通过横向扩展增加容量,例如添加额外的测功机/服务器

通常,随着更多服务器/dynos 开始运行以分散请求,并且单个机器上的所有线程同时处理最大请求的事件减少,增加容量的效果非常好。然而,从长远来看,减少整体内存需求的最佳途径是减少对象分配。


这个用例

在这个用例中,它似乎按照第一个代码块,即 def create(id: str) 为大约 100 个 ID 值自动构建模型,您的应用程序能够扩展但是随后,当您 def create_all() 时,您开始看到错误。


解决方案

除了在 go 中为每个 ID 创建所有模型之外,您还可以采用不同的方法。如果可能,将 ID 值划分为批处理运行,每个批处理都包含最佳数量的模型,这样内存使用量就不会超过阈值。

关于python - 错误 R14(超出内存配额)导致在 Heroku 中使用 Selenium 与 Python、FastAPI 和 Celery 时出现 TimeoutException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71654588/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com