Airflow v2.6.3 running spark jobs on a DAG, successful jobs are retrying, 2nd iteration will fail with "Received SIGTERM" error(AirFlow v2.6.3正在DAG上运行Spark作业，正在重试成功的作业，第二次迭代将失败，并显示“Recent SIGTERM”(已接收信号)错误)-6ren

Airflow v2.6.3 running spark jobs on a DAG, successful jobs are retrying, 2nd iteration will fail with "Received SIGTERM" error(AirFlow v2.6.3正在DAG上运行Spark作业，正在重试成功的作业，第二次迭代将失败，并显示“Recent SIGTERM”(已接收信号)错误)

转载作者：bug小助手更新时间：2023-10-24 20:13:41

34

4

On airflow v2.6.3, I run daily spark jobs. Every once in a while, a successful job in the dag will retry the job through an EMRSensor. That retried job will show a "State of this instance has been externally set to up_for_retry. Terminating instance." error followed by "ERROR - Received SIGTERM. Terminating subprocesses". This causes the rest of the DAG to have an upstream failure. The initial EMRSensor job doesn't show a "1 downstream tasks scheduled from follow-on schedule task" message after detecting a successful job. It simply retries the job.

在Airflow v2.6.3上，我每天运行Spark作业。每隔一段时间，DAG中的成功作业都会通过EMR传感器重试该作业。重试的作业将显示“此实例的状态已在外部设置为up_for_retry。正在终止实例。”错误后接“Error-Receied SIGTERM.Terminating SubProcess”(收到错误信号。终止子进程)。这会导致DAG的其余部分出现上游故障。在检测到一个成功的作业后，初始EMR传感器作业没有显示“从后续调度任务调度的1个下游任务”消息。它只是重试该作业。

Previously, on airflow v2.2.2, this occurred around 5 times a week on daily jobs. Upgrading from v2.2.2 to v2.6.3 resulted in this error not showing until a week later.

以前，在Airflow v2.2.2中，这在日常工作中每周大约发生5次。从v2.2.2升级到v2.6.3导致此错误在一周后才会显示。

Something I noticed as well was for the EMRSensor jobs that are detect successful jobs but don't continue to upstream jobs, the airflow logs don't have some starting and ending lines that the other successful and continued jobs have:

我还注意到，对于检测到成功作业但没有继续上游作业的EMR传感器作业，气流日志没有其他成功和继续作业所具有的一些开始和结束行：

The first 5 lines are omitted

Similarly, at the end of the airflow log, the last 2 lines are omitted:

同样，在气流记录的末尾，省略了最后两行：

Last 2 lines omitted

Does anyone know what's going on? Seems like a heartbeat spark timeout issue since its occurring sporadically.

有人知道这是怎么回事吗？看起来像是心跳火花超时问题，因为它偶尔会发生。

The airflow DAG is triggering sparksubmit jobs on an EMR node on EC2.

气流DAG正在触发EC2上EMR节点上的触发提交作业。

Upgrading to v2.6.3

更多回答

优秀答案推荐

更多回答

34

4

0

文章推荐： Kivy - Black screen error in label(Kivy-标签中的黑屏错误)

文章推荐： Unable to run Java program with vscode(无法使用vscode运行Java程序)

dart - ShadowDom外部的父级的属性已更改(显示:无->显示:flex->显示:无)
我的Angular-Component位于一个flexbox(id =“log”)中。可以显示或隐藏flexbox。我的组件内部有一个可滚动区域，用于显示日志消息。 (id =“message-li
phpinfo() 显示 MySQL，PMA 显示 MariaDB
我真的很困惑有一个 phpinfo() 输出: MySQL 支持启用客户端 API 版本 5.5.40 MYSQL_MODULE_TYPE 外部 phpMyAdmin 显示: 服务器类型:Mar
jquery - 在 jquery 切换中单击时更改按钮文本(显示/隐藏/显示)
我正在研究这个 fiddle : http://jsfiddle.net/cED6c/7/我想让按钮文本在单击时发生变化，我尝试使用以下代码: 但是，它不起作用。我应该如何实现这个？任何帮助都会很棒
php - cakephp 显示 ID 显示 table.name 来自两个不同表的关系
我应该在“dogs_cats”中保存表“dogs”和“cats”各自的ID，当看到数据时显示狗和猫的名字。我有这三个表: CREATE TABLE IF NOT EXISTS cats ( id
php - 使用 Blade 显示 HTML 显示 HTML 代码
我有一个字符串返回到我的 View 之一，如下所示: $text = 'Lorem ipsum dolor ' 我正在尝试用 Blade 显示它: {{$text}} 但是，输出是原始字符串而不是渲染
jquery - 使用 JQuery 显示/隐藏隐藏/显示 div，但单击按钮没有效果
我无法让我的链接(由图像表示，位于页面左侧)真正有效地显示一个 div(包含一个句子，位于中间)/单击链接时隐藏。这是我的代码: Practice
javascript - 显示 image1 的脚本，然后(随机毫秒)显示 image2 并停止
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
c# - ListView 显示 4 条记录。 DataGridView 显示 3 条记录？
最初我使用 Listview 来显示 oracle 结果，但是最近我不得不切换到 datagridview 来处理比 Listview 允许的更多的结果。然而，自从切换到数据网格后，我得到的结果越来越
xml - 如何使用 Apache fop 显示 Unicode 字符？显示 "?"而不是字符。
我一直在尝试插入一个 Unicode 字符 ∇ 或 ▽，所以它显示在 Apache FOP 生成的 PDF 中。这是我到目前为止所做的: 根据这个基本帮助 Apache XSL-FO Input，您
node.js - pm2 显示 1.2GB 而 heapdump 显示 80MB
我正在使用 node v0.12.7 编写一个 nodeJS 应用程序。我正在使用 pm2 v0.14.7 运行我的 nodejs 应用程序。我的应用程序似乎有内存泄漏，因为它从我启动时的大约 1
jquery - 如果 x 显示 x 如果 y 显示 y(我知道这个标题不好)
好的，所以我有一些 jQuery 代码，如果从下拉菜单中选择了带有前缀 Blue 的项目，它会显示一个输入框。代码: $(function() { $('#text1').hide();
google-chrome - Chrome 中的“检查元素”显示 LESS，但 Firefox 显示 CSS
当我试图检查 Chrome 中的 html 元素时，它显示的是 LESS 文件，而 Firefox 显示的是 CSS 文件。 (我正在使用 Bootstrap 框架) 如何在 Chrome 中查看 c
python - Microsoft Bot Emulator 显示 "sending failed. Retry"。 VSCode 显示 KeyError : 'HTTP_CONTEXT_TYPE'
我是 Microsoft Bot Framework 的新手，我正在通过 youtube 视频 https://youtu.be/ynG6Muox81o 学习它并在 Ubuntu 上使用 python
encoding - notepad++ 显示 ucs-2LE 而 ubuntu FILE [file] 显示 UTF-16LE，我很困惑？
我正在尝试转换从 mssql 生成的文件到 utf-8。当我打开他的输出 mssql在 Windows Server 2003 中使用 notepad++ 将文件识别为 UCS-2LE我使用 file
javascript帮助日期/显示
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
jQuery点击关闭div(显示)
我正在尝试执行单击以打开/关闭一个 div 的功能。这是基本的，但是，点击只显示 div，当我点击“关闭”时，没有任何反应。 $(".inscricao-email").click(function
flutter - 显示/隐藏小部件而不重新创建它
假设我有 2 张卡片，屏幕上一次显示一张。我有一个按钮可以用其他卡片替换当前卡片。现在假设卡 1 上有一些数据，卡 2 上有一些数据，我不想破坏它们每个上的数据，或者我不想再次重建它们中的任何一个。
javascript - 显示()未定义
我正在使用 Eloquent Javascript 学习 Javascript。我在 Firefox 控制台上编写了以下代码，但它返回:“ReferenceError:show() 未定义”为什么？
symfony - 显示/隐藏某些菜单取决于奏鸣曲管理员角色
我正在使用 Symfony2 开发一个 web 项目，我使用 Sonata Admin 作为管理面板，一切正常，但我想要做的是，在 Sonata Admin 的仪表板菜单上，我需要显示隐藏一些菜单取决
angularjs - 显示/隐藏div取决于AngularJS中的下拉列表选择
我试图显示一个div，具体取决于从下拉列表中选择的内容。例如，如果用户从列表中选择“现金”显示现金div或用户从列表中选择“检查”显示现金div 我整理了样本，但样本不完整，需要接线 http://j

首页

博学

6Ren·AI

商城

Airflow v2.6.3 running spark jobs on a DAG, successful jobs are retrying, 2nd iteration will fail with "Received SIGTERM" error(AirFlow v2.6.3正在DAG上运行Spark作业，正在重试成功的作业，第二次迭代将失败，并显示“Recent SIGTERM”(已接收信号)错误)