gpt4 book ai didi

azure - 如何使用 azure 复制事件加载具有重叠但动态架构列的多个文件?

转载 作者:行者123 更新时间:2023-12-03 02:41:45 25 4
gpt4 key购买 nike

我有大约 7-8 个文件,它们具有不同但重叠的架构。但是我希望目标( azure 突触表)的架构是最大列数的架构。

我的文件有 - 61 列、93 列和 96 列所以我的目标表将有 96 列

但是在加载 61 列表时,我希望将其余 30 行加载为 NULL。我正在使用数据流使用 *.csv 选项递归加载。

谁能告诉我如何实现这一目标吗?

我的源是 azure BLOB 中的 csv 文件,我的目标是一个具有 96 列架构的表。

(还有一个问题是,只有一个文件有两列名称不同但值相同,我不知道如何映射它,否则它看起来像另外两列新列,我们最终将有 98 列)

我也无法进行手动映射,因为对这么多文件进行手动映射会花费很多时间。

请告诉我。提前致谢

最佳答案

我尝试通过 ADF 中的复制事件来实现您的要求。

准备测试数据:

blob 存储容器中的三个文件。

enter image description here

enter image description here

enter image description here

SQL DB 中的列设置:

enter image description here

然后使用“获取元数据事件”和“对于 ADF 中的每个事件”:

enter image description here

获取元数据事件的配置:

enter image description here

每个事件的配置:

enter image description here

在每个事件中,请使用复制事件。将blob存储设置为源数据集,并将sql db(我使用sql db进行测试,您可以在这里使用synapse db)作为sink数据集。

enter image description here

SQL 数据库中的测试结果:

enter image description here

此外,说实话,我没有找到任何方法来映射只有一个文件有两列名称不同但值相同。我相信到目前为止 ADF 还不支持它。既然你肯定知道哪一列符合这种情况,你可以稍后使用代码来处理它们。(我认为这不是太难)

关于azure - 如何使用 azure 复制事件加载具有重叠但动态架构列的多个文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60925477/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com