python - BranchPythonOperator 后的 Airflow 任务不会失败并正确成功

转载作者：太空狗更新时间：2023-10-30 02:24:47

32

4

在我的 DAG 中，我有一些任务只能在周六运行。因此，我使用 BranchPythonOperator 在星期六的任务和 DummyTask 之间进行分支。之后，我加入了两个分支并想运行其他任务。

工作流程如下所示:
在这里，我将 dummy3 的触发规则设置为 'one_success' 并且一切正常。

我遇到的问题是当 BranchPythonOperator 上游的某些东西失败时:
BranchPythonOperator 和分支正确地具有状态'upstream_failed'，但加入分支的任务变为'skipped'，因此整个工作流显示'success'.

我尝试使用 'all_success' 作为触发规则，然后如果某事失败整个工作流程失败，它会正常工作，但如果没有失败，dummy3 将被跳过。

我还尝试将 'all_done' 作为触发规则，如果没有失败，它会正常工作，但如果有失败，dummy3 仍然会被执行。

我的测试代码是这样的:

from datetime import datetime, date
from airflow import DAG
from airflow.operators.python_operator import BranchPythonOperator, PythonOperator
from airflow.operators.dummy_operator import DummyOperator

dag = DAG('test_branches',
          description='Test branches',
          catchup=False,
          schedule_interval='0 0 * * *',
          start_date=datetime(2018, 8, 1))


def python1():
    raise Exception('Test failure')
    # print 'Test success'


dummy1 = PythonOperator(
    task_id='python1',
    python_callable=python1,
    dag=dag
)


dummy2 = DummyOperator(
    task_id='dummy2',
    dag=dag
)


dummy3 = DummyOperator(
    task_id='dummy3',
    dag=dag,
    trigger_rule='one_success'
)


def is_saturday():
    if date.today().weekday() == 6:
        return 'dummy2'
    else:
        return 'today_is_not_saturday'


branch_on_saturday = BranchPythonOperator(
    task_id='branch_on_saturday',
    python_callable=is_saturday,
    dag=dag)


not_saturday = DummyOperator(
    task_id='today_is_not_saturday',
    dag=dag
)

dummy1 >> branch_on_saturday >> dummy2 >> dummy3
branch_on_saturday >> not_saturday >> dummy3

编辑

我刚刚想出了一个丑陋的解决方法:
dummy4 代表我实际需要运行的任务，dummy5 只是一个虚拟对象。
dummy3 仍然有触发规则 'one_success'。

现在，如果没有上游故障，dummy3 和 dummy4 就会运行，如果当天不是星期六，dummy5 就会“运行”，如果那天是星期六，则会被跳过，这意味着 DAG 在这两种情况下都被标记为成功。
如果上游出现故障，则跳过 dummy3 和 dummy4，并将 dummy5 标记为 'upstream_failed'，并将 DAG 标记为失败。

此变通办法使我的 DAG 按我希望的方式运行，但我仍然更喜欢没有一些 hacky 变通办法的解决方案。

最佳答案

您可以使用的一种解决方法是将 DAG 的第二部分放在 SubDAG 中，就像我在以下说明示例的代码中所做的那样:https://gist.github.com/cosenal/cbd38b13450b652291e655138baa1aba

它按预期工作，并且可以说它比您的解决方法更干净，因为您没有任何额外的辅助虚拟运算符。但是，您失去了平面结构，现在您必须放大 SubDag 才能看到内部结构的细节。

更一般的观察:在对您的 DAG 进行试验后，我得出结论，Airflow 需要类似 JoinOperator 的东西来替换您的 Dummy3 运算符。让我解释。您描述的行为来自这样一个事实，即 DAG 的成功仅基于最后一个运算符的成功(或跳过!)。

以下以“成功”状态结尾的 DAG 是支持上述声明的 MWE。

def python1():
    raise Exception('Test failure')

dummy1 = PythonOperator(
    task_id='python1',
    python_callable=python1,
    dag=dag
)

dummy2 = DummyOperator(
    task_id='dummy2',
    dag=dag,
    trigger_rule='one_success'
)

dummy1 >> dummy2

只有当直接父级之一成功并且所有其他父级都被跳过时才触发的 JoinOperator 会很酷，而不必使用 trigger_rule 参数.

或者，可以解决您遇到的问题的方法是触发规则 all (success | skipped)，您可以将其应用于 Dummy3。遗憾的是，我认为您还不能在 Airflow 上创建自定义触发规则。

编辑:在这个答案的第一个版本中，我声称触发规则 one_success 和 all_success 根据成功的程度触发所有 DAG 中运算符的祖先，而不仅仅是直接父代。这与 documentation 不匹配事实上，它在以下实验中无效:https://gist.github.com/cosenal/b607825539aa0d308f10f3095e084fac

关于python - BranchPythonOperator 后的 Airflow 任务不会失败并正确成功，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51664755/

32

4

0

文章推荐： python - PonyORM - 多个模型文件

文章推荐：对象上的 Python itertools 组合

文章推荐： python - 直接调用时如何使python对象返回属性数据

文章推荐： python - 如何按多级行对 python 数据框进行分组？

javascript - 如果输入 a 或 b 正确/正确，我如何执行操作？
这个问题已经有答案了: How to do case insensitive string comparison? (23 个回答) 已关闭 3 年前。用户在我的输入栏中写入“足球”，然后执行第 6
javascript - 字符 id= + 是 + 正确= + 正确不正确...我怎样才能使它成为 javascript 中的字符串
啊，不习惯 javascript 中的字符串。 character_id= + id + correct= + correctOrIncorrect 这就是我需要制作成字符串的内容。如果您无法猜测字符
javascript - jQuery计算价格不起作用(正确)
$(function() { var base_price = 0; CalculatePrice(); $(".math1").on('change', function(e) { Calc
kubernetes - 将Spinnaker部署到Spinnaker将管理的同一kubernetes集群是否安全/正确？
我找不到任何文章回答问题:将Spinnaker部署到Spinnaker将管理的同一Kubernetes集群是否安全/正确？我主要是指生产，HA部署。最佳答案我认为Spinnaker和Kuberne
c++ - 正确/快速的方法来更改命令行Qt5源内部版本的配置
我正在使用MSVC在Windows上从源代码(官方源代码发布，而不是从仓库中)构建Qt5(Qt 5.15.0)。我正在设置环境。变量，依赖项等，然后运行具有1600万个选项的configure，最后
java - 计数时数组越界[正确]
我需要打印一个包含重复单词的数组。我的数组已经可以工作，但我不知道如何正确计算单词数。我已经知道，当我的索引计数器 (i) 为 49 时，并且当 (i) 想要计数到 50 时，我会收到错误，但我不知道
javascript - 正确/错误取决于屏幕尺寸动态？
我正在遵循一个指南，该指南允许 Google map 屏幕根据屏幕尺寸禁用滚动。我唯一挣扎的部分是编写一个代码，当我手动调整屏幕大小时动态更改 True/False 值。这是我按照说明操作的网站，但
java - 未调用子类中的方法(正确)
我有一个类“FileButton”。它的目的是将文件链接到 JButton，FileButton 继承自 JButton。子类继承自此以使用链接到按钮的文件做有用的事情。 JingleCardButt
php - 如何仅显示来自好友列表的帖子。 (正确)
我的 friend 数组只返回一个数字而不是所有数字。 ($myfriends = 3) 应该是…… ($myfriends = 3 5 7 8 9 12). 如果我让它进入 while 循环……整个
html - 在这种情况下使用整数作为类名是否可以接受/正确
这个问题在这里已经有了答案: Is there a workaround to make CSS classes with names that start with numbers valid?
javascript - 在窗口更改时自动调整元素大小(正确)
我正在制作一个 JavaScript 函数，当调整窗口大小时，它会自动将 div 的大小调整为与窗口相同的宽度/高度。该功能非常基本，但我注意到在调整窗口大小时出现明显的“绘制”滞后。在 JS fi
javascript - 删除导航栏的类 - 正确
此问题的基本视觉效果可在 http://sevenx.de/demo/bootstrap-carousel/inc.carousel/tabbed-slider.html 获得。 - 如果你想看一看。
c - 从将其内存分配给同一函数的函数返回字符串是否安全/正确？
我明白，如果我想从函数返回一个字符串文字或一个数组，我应该将其声明为静态的，这样当被调用的函数被返回时，内容就不会“消亡”。但我的问题是，当我在函数内部使用 malloc 分配内存时会怎样？在下面
mysql - 正确/错误值的适当数据字段类型？
在 mySQL 数据库中存储 true/false/1/0 值最合适(读取数据消耗最少)的数据字段是什么？我以前使用过一个字符长的 tinyint，但我不确定它是否是最佳解决方案？谢谢! 最佳答案
c++ - 正确，有效地读取文件
我想一次读取并处理CSV文件第一行中的条目(例如打印)。我假设使用Unix风格的\n换行符，没有条目长度超过255个字符，并且(现在)在EOF之前有一个换行符。这意味着它是fgets()后跟strto
c++ - “正确”无符号整数比较
所以，我们都知道 -1 > 2u == true 的 C/C++ 有符号/无符号比较规则，并且我有一种情况，我想有效地实现“正确”比较。我的问题是，考虑到人们熟悉的尽可能多的架构，哪种方法更有效。显
Java异常处理：如何写出“正确”但被编译器认为有语法错误的程序
**摘要：**文章的标题看似自相矛盾。本文分享自华为云社区《Java异常处理：如何写出“正确”但被编译器认为有语法错误的程序》，作者： Jerry Wang 。文章的标题看似自相矛盾，然而我在“正
r - 进行按行替换的“正确”方法
我有一个数据框，看起来像: dataDemo % mutate_each(funs(ifelse(. == '.', REF, as.character(.))), -POS) # POS REF
text - VBScript 正确/重新格式化带分隔符的文本文件？
有人可以帮助我使用 VBScript 重新格式化/正确格式化带分隔符的文本文件吗？我有一个文本文件 ^分界如下: AGREE^NAME^ADD1^ADD2^ADD3^ADD4^PCODE^BAL^A
java - 语言认证以及诸如适当、正确、合法等术语的使用
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he

首页

博学

6Ren·AI

商城

python - BranchPythonOperator 后的 Airflow 任务不会失败并正确成功

编辑