gpt4 book ai didi

python - Airflow local_task_job.py - 任务退出并返回代码 -9

转载 作者:行者123 更新时间:2023-12-04 10:45:51 29 4
gpt4 key购买 nike

我正在尝试使用 v1.10.5 在 ECS 中运行 Apache Airflow apache/airflow 的版本使用我的 fork airflow .我正在使用 env 变量将执行程序、Postgres 和 Redis 信息设置为网络服务器。

AIRFLOW__CORE__SQL_ALCHEMY_CONN="postgresql+psycopg2://airflow_user:airflow_password@postgres:5432/airflow_db"
AIRFLOW__CELERY__RESULT_BACKEND="db+postgresql://airflow_user:airflow_password@postgres:5432/airflow_db"
AIRFLOW__CELERY__BROKER_URL="redis://redis_queue:6379/1"
AIRFLOW__CORE__EXECUTOR=CeleryExecutor
FERNET_KEY=46BKJoQYlPPOexq0OhDZnIlNepKFf87WFwLbfzqDDho=
AIRFLOW__CORE__LOAD_EXAMPLES=False

我的任务随机失败并出现以下错误
[2020-01-12 20:06:28,308] {ssh_utils.py:130} WARNING - 20/01/13 01:36:28 INFO db.IntegerSplitter: Split size: 134574; Num splits: 5 from: 2 to: 672873
[2020-01-12 20:06:28,449] {ssh_utils.py:130} WARNING - 20/01/13 01:36:28 INFO mapreduce.JobSubmitter: number of splits:5
[2020-01-12 20:06:28,459] {ssh_utils.py:130} WARNING - 20/01/13 01:36:28 INFO Configuration.deprecation: mapred.job.name is deprecated. Instead, use mapreduce.job.name
[2020-01-12 20:06:28,964] {ssh_utils.py:130} WARNING - 20/01/13 01:36:28 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1578859373494_0012
[2020-01-12 20:06:29,337] {ssh_utils.py:130} WARNING - 20/01/13 01:36:29 INFO impl.YarnClientImpl: Submitted application application_1578859373494_0012
[2020-01-12 20:06:29,371] {ssh_utils.py:130} WARNING - 20/01/13 01:36:29 INFO mapreduce.Job: The url to track the job: http://ip-XX-XX-XX-XX.ap-southeast-1.compute.internal:20888/proxy/application_1578859373494_0012/
[2020-01-12 20:06:29,371] {ssh_utils.py:130} WARNING - 20/01/13 01:36:29 INFO mapreduce.Job: Running job: job_1578859373494_0012
[2020-01-12 20:06:47,489] {ssh_utils.py:130} WARNING - 20/01/13 01:36:47 INFO mapreduce.Job: Job job_1578859373494_0012 running in uber mode : false
[2020-01-12 20:06:47,490] {ssh_utils.py:130} WARNING - 20/01/13 01:36:47 INFO mapreduce.Job: map 0% reduce 0%
[2020-01-12 20:06:54,777] {logging_mixin.py:95} INFO - [[34m2020-01-12 20:06:54,777[0m] {[34mlocal_task_job.py:[0m105} INFO[0m - Task exited with return code -9[0m

但是当我在 EMR UI 中检查某个应用程序时,它显示为已成功运行。

enter image description here

我的ECS配置如下

Airflow worker

硬/软内存限制 -> 2560/1024

worker 数量 -> 3

Airflow 网络服务器

硬/软内存限制 -> 3072/1024

Airflow 调度器

硬/软内存限制 -> 2048/1024

运行时间 -> 86400

是什么导致了这个错误?

最佳答案

错误是由于工作容器达到了硬内存限制,因此随机终止了任务。我通过比较通过本地执行程序运行的旧 Airflow 部署的内存利用率图来增加内存限制来解决此问题

这是关于软内存限制的旧内存利用率图

enter image description here

将工作内存配置更改为 2560/5120 后,现在这是相对于软内存限制的内存利用率图

enter image description here

关于python - Airflow local_task_job.py - 任务退出并返回代码 -9,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59711336/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com