gpt4 book ai didi

Azure 数据工厂 |从 SFTP 到 Blob 的增量数据加载

转载 作者:行者123 更新时间:2023-12-05 03:05:49 25 4
gpt4 key购买 nike

我创建了一个(一旦运行)DF (V2) 管道,用于将文件 (.lta.gz) 从 SFTP 服务器加载到 azure blob 中以获取历史数据。干得漂亮。SFTP服务器上每天都会有几个新文件(无法操作或删除)。所以我想创建一个增量加载管道,每天检查新文件 - 如果是的话 ---> 复制新文件。

有人可以告诉我如何实现这一目标吗?

最佳答案

感谢您使用数据工厂!

要在 SFTP 服务器上增量加载新生成的文件,您可以利用 GetMetadata 事件来检索 LastModifiedDate 属性: https://learn.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity

本质上,您编写了一个包含以下事件的管道:

  • getMetadata(返回给定文件夹下的文件列表)
  • ForEach(遍历每个文件)
  • getMetadata(返回给定文件的最后修改时间)
  • IfCondition(将lastModifiedTime与触发器WindowStartTime进行比较)
  • 复制(将文件从源复制到目标)

享受使用数据工厂构建数据集成流程的乐趣!

关于Azure 数据工厂 |从 SFTP 到 Blob 的增量数据加载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50298122/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com