gpt4 book ai didi

azure - 在 Azure 上暂存或登陆

转载 作者:行者123 更新时间:2023-12-03 01:31:20 25 4
gpt4 key购买 nike

我正在 Azure 数据工厂中执行 ETL,我只是想在进一步操作之前确认我对它的理解。请找到下面所附的图片。

enter image description here

我正在从多个源收集数据并将其存储在 Azure Blob 存储中,然后执行转换和加载。我感到困惑的是,在我的例子中,Azure Blob 存储是着陆区还是暂存区。有些人互换使用这些术语,无法理解这两个术语之间的细微差别。

另外,谁能解释一下提取、转换和加载是哪一部分。在我的理解中,从多个源收集数据并将其存储到 Azure Blob 存储中是提取,Azure 数据工厂是转换,将转换后的数据复制到 Azure 数据库中是加载。我是正确的还是我在这里误解了什么?

最佳答案

What I am confused about is that whether Azure Blob Storage is a landing or staging area here in my case.

就您而言,Azure Blob 存储既是着陆区域又是暂存区域。着陆区是指从不同地方收集数据的区域。暂存区是指仅保存一段时间的数据,在ETL过程中应删除暂存数据。

Also, can anyone explain me which part is Extract, Transform and Load is.

Copy Activity是一种典型的基于ETL的技术。如果仅谈论Azure数据工厂的复制事件,当您指定复制源后,ADF将基于此执行复制事件,这就是“提取”。 ADF 中根据您的设置将数据传输到指定 Sink 的部分,这是“Load”,复制行为的详细信息是“Transform”。如果您查看整个过程,您将数据收集到 blob 存储也是“提取”。

关于azure - 在 Azure 上暂存或登陆,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62207736/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com