gpt4 book ai didi

json - Azure 数据工厂 - 从 Data Lake Gen 2 JSON 文件中提取信息

转载 作者:行者123 更新时间:2023-12-04 08:05:17 25 4
gpt4 key购买 nike

我有一个 ADF 管道将原始日志数据作为 JSON 文件加载到 Data Lake Gen 2 容器中。

我们现在想从这些 JSON 文件中提取信息,我正试图找到从所述文件中获取信息的最佳方法。我发现 Azure Data Lake Analytics 和 U-SQL 脚本非常强大而且便宜,但它们需要陡峭的学习曲线。

是否有推荐的方法来解析 JSON 文件并从中提取信息? Data Lake 表是否足以存储这些提取的信息,然后充当下游报告流程的来源?

最后,Azure 数据工厂是否能够解析嵌套数组 JSON?

最佳答案

我们可以通过data flow解析JSON文件并提取信息.我们可以通过 Flatten 解析嵌套数组 JSON。映射数据流的转换。

Json 示例:

    {   
"count": 1,
"value": [{
"obj": 123,
"lists": [{
"employees": [{

"name": "",
"id": "001",
"tt_1": 0,
"tt_2": 4,
"tt3_": 1
},
{
"name": "",
"id": "002",
"tt_1": 10,
"tt_2": 8,
"tt3_": 1
}]
}]
}]
}

enter image description here展平事件设置和输出预览: enter image description here

enter image description here

映射数据流遵循提取、加载和转换 (ELT) 方法,并使用全部在 Azure 中的暂存数据集。目前,以下数据集可用于源转换。 enter image description here

所以我认为在 ADF 中使用数据流是提取信息并作为下游报告流程的来源的最简单方法。

关于json - Azure 数据工厂 - 从 Data Lake Gen 2 JSON 文件中提取信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66246504/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com