- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Airflow 运行工作流 DAG。我设置的开始日期是 5/26/2014,schedule_interval 是 1 天,没有结束日期,它使用的是 Celery Executor。 Airflow 从给定日期开始运行我的任务,并按预期从开始日期开始每天递增。
但问题是,它只会从开始日期开始安排和运行 16 天,然后停止。我必须重新启动调度程序服务才能安排下一组 dag 并运行。
我修改了下面的属性,在airflow.cfg 中将它们设置为更高,但仍然不起作用,
dag_concurrency = 9999
max_active_runs_per_dag = 9999
parallellism = 9999
celeryd_concurrency = 4
最佳答案
不确定我是否理解正确,您是否希望从某个日期到接下来的 16 天运行日常工作?
如果是这样,它与airflow.cfg 没有任何关系,如果您有很多Dag,您发布的设置实际上可以“杀死”您的机器,这是关于将并行运行和调度的任务实例.
我想你需要的是定义一个 start_date 和 end_date。
当您构建将承担这项工作的 DAG 时,您就可以做到这一点。
一种方法是定义 default_args,然后在您的 dag 上使用它们。
default_args = {
'owner': 'userXX',
'start_date': datetime(2014, 05, 26),
'end_date': datetime(2014, 06, 11),
'email': ['mail1..','mail2...'],
...
}
mydag = DAG(
PARENT_ID, default_args=default_args,
schedule_interval="@daily",
user_defined_macros=user_defined_macros
)
_some_Operator(
task_id='task_idxx',
.. other settings/jobrun...
dag=mydag,
)
关于python-2.7 - Airflow 回填不工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38273302/
设置 考虑 df = pd.DataFrame(index=pd.date_range('2016-03-01', '2016-03-08'), columns=list('ABC')) df.ilo
我经常遇到必须从另一个数据源“填写”信息的情况。 例如: x 2 b y 3 c x 4 d w 5 e v 6 f u 7 g t 8
所以这是场景: 我们有一个 m_reading 表,每天都会在其中提取 24 个读数。 在 24 个读数中,23 个是当天的读数,1 个是前一天的读数。 物化 View 应该聚合天数数据。 业务用户可
假设您有一个 Airflow DAG,回填没有意义,这意味着,在它运行一次之后,再快速运行它之后的时间将完全没有意义。 例如,如果您从某个仅每小时更新一次的来源将数据加载到数据库中,那么快速连续发生的
我有一个如下所示的 DAG,dagrun_timeout 设置为 4 小时。当我转到 UI 并清除从 start_date 到 present 的所有任务时,所有 DAG 都设置为运行状态。 4 小时
我的第一篇文章。我在 Google Analytics(分析)中的目标漏斗中遇到了大问题。 我们设置了一个漏斗来跟踪从我们的主要公司网站到在第三方网站上处理的用户注册的注册(使用虚拟网页浏览来跟踪用户
试图找出一种方法来回填 ds 分区 Hive 表的分区。 我知道如何从 CLI 运行 Hive 命令,例如 $HIVE_HOME/bin/hive -e 'select a.col from tab1
https://cloud.google.com/bigquery/docs/reference/datatransfer/rest/ 我正在寻找“bigquery 数据传输服务”的 php 客户端库
我是一名优秀的程序员,十分优秀!