- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们使用 Amazon MWAA Airflow,很少有一些任务被标记为“失败”,但根本没有日志。就好像容器在没有注意到我们的情况下被关闭了一样。
我找到了这个链接:
https://cloud.google.com/composer/docs/how-to/using/troubleshooting-dags#task_fails_without_emitting_logs
这由机器上的OOM解释。但是我们的任务几乎不使用 CPU 和 RAM。他们只对 AWS API 进行 1 次 HTTP 调用。所以很轻。
在 Cloudwatch 上,我可以看到没有其他任务在同一个容器上启动(DAG 运行通过打印容器 IP 开始,因此我可以在所有任务上搜索此 IP)。
如果有人有想法,那就太好了,谢谢!
最佳答案
MWAA 使用 ECS 作为后端,事情的工作方式是 ECS 将根据集群中运行的任务数量自动调整工作线程的数量。对于小环境,默认每个worker可以处理5个任务。如果有超过 5 个任务,那么它将扩展另一个 worker ,依此类推。
我们不对 Airflow 进行任何计算(批处理、长时间运行的作业),我们的 Dag 主要是对其他服务的 API 请求,这意味着我们的 Dag 运行速度快且生命周期短。有时,我们可以在很短的时间(几秒钟)内完成八个或更多任务。在这种情况下,自动缩放将触发向外扩展并向集群添加一个或多个工作器。然后,由于这些任务只是 API 请求,所以它很快就会被执行,任务数量 下降到 0 触发规模(删除 worker )。如果在那个确切的时刻安排了另一个任务,那么 Airflow 最终将在正在移除的容器上运行该任务,并且您的任务将在中间被杀死而没有任何通知(竞争条件)。发生这种情况时,您通常会看到不完整的日志。
第一个解决方法是通过卡住集群中的工作人员数量来禁用自动缩放。您可以将 min 和 max 设置为适当的工作人员数量,这取决于您的工作量。我们同意,我们失去了服务的弹性。
$ aws mwaa update-environment --name MyEnvironmentName --min-workers 2 --max-workers 2
AWS 建议的另一个解决方案是始终运行一个虚拟任务(无限循环),这样您就永远不会扩展所有工作人员。
关于amazon-web-services - Amazon MWAA Airflow - 任务容器在没有日志的情况下关闭/停止/终止,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67332106/
我正在尝试在 MWAA 上的 dag 中使用本地模块。 文件夹结构如下: . ├── __init__.py ├── dags │ ├── __init__.py │ └── my_dag │
我更新了我的 MWAA 环境中的一些 Airflow 配置选项,它在过去三个小时内一直处于“正在更新”状态! 有人知道如何强制删除该环境吗?使用 AWS MWAA 控制台上的“删除”按钮只会导致“具有
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭去年。 Improve th
AWS MWAA (Managed Workflows for Apache Airflow) 是 AWS 提供的相对较新的服务。配置 MWAA 环境时,可以提供自定义 requirements.tx
Cloudformation 在创建 AWS MWAA 集群时返回以下错误: Resource handler returned message: 'Creation failed' (Request
我们使用 Amazon MWAA Airflow,很少有一些任务被标记为“失败”,但根本没有日志。就好像容器在没有注意到我们的情况下被关闭了一样。 我找到了这个链接: https://cloud.go
所以,我们可以从这个有趣的问题中看到:https://github.com/aws/aws-cli/issues/4947 AWS CLI 2 永远不会被推送到 pip。 在 AWS MWAA(Man
我有一个 AWS MWAA Airflow v2.0.2 实例正在运行。 我想访问 Airflow API .这是目前支持的东西吗?计划在 future 发布? AWS 文档中没有提到这一点。 看起来
我们正在使用 AWS MWAA。我们以编程方式将 DAG.py 文件添加到我们的 S3 存储桶中。然后它们会出现在 UI 中。但是,它们处于“关闭”状态,您必须单击“打开”按钮才能启动它们。 编辑:此
我已将我的 requirementst.txt 上传到 dag 并在创建我的 Airflow 环境时引用它。这是我的 requirements.txt 的样子: apache-airflow==1.1
I am executing dbt cli commands using Airflow(using dbt.cli.main from dbt documentation) in my ai
我的 AWS 账户中有一个 MWAA Airflow 环境。我设置的DAG应该从S3 bucket A中读取大量数据,过滤我想要的并将过滤后的结果转储到S3 bucket B。它需要每分钟读取一次,因
我是一名优秀的程序员,十分优秀!