gpt4 book ai didi

Azure 数据湖 VS Azure HDInsight

转载 作者:行者123 更新时间:2023-12-04 03:06:23 27 4
gpt4 key购买 nike

我正在浏览 Microsoft 文档:

https://learn.microsoft.com/en-us/azure/data-lake-store/data-lake-store-overview

我是 Azure 数据湖和 HDInsight 的新手。 URL 中有一条语句表明

"Azure Data Lake Store can be accessed from Hadoop (available with HDInsight cluster) using the WebHDFS-compatible REST APIs."

根据我的初步理解,数据湖存储是可以存储任何类型数据的存储。我认为,HDInsight 也做了同样的事情。

我的问题是 Azure 数据湖和 Azure HDInsight 之间有什么区别?如果 HDInsight 可用于文件存储或任何类型的存储,那么为什么要使用 Data Lake?如果有人能详细阐明这一点,那就太好了。谢谢。

最佳答案

想到数据湖的最简单方法就是想象这个大型容器,它就像一个真正的湖泊,有河流汇入河流,你永远不知道河流从哪里来(或者什么“类型”的河流)。引入 Azure Data Lake 的目的是让开发人员、数据科学家和分析师能够轻松存储任何规模的大数据。 它消除了摄取和存储所有数据的复杂性,同时加快了大数据的启动和运行。数据湖能够存储大量不同类型的数据(结构化数据、非结构化数据、日志文件、实时数据、图像等)并将其混合在一起,以关联许多不同的数据类型。这里的关键是我们正在从传统方式转向现代工具(如 Hadoop、Cassandra、NoSQL DB 等)。 Azure Data Lake 包括三项服务:

  • Azure Data Lake Store,一个为大数据提供支持的无限制数据湖分析
  • Azure Data Lake Analytics,大规模并行按需分析就业服务
  • Azure HDInsight,完全托管的云 Hadoop 和 Spark提供

enter image description here

Azure Data Lake Store 就像基于云的文件服务或文件系统,其大小几乎不受限制。我们可以在该存储中的数据之上运行服务。因此,您可以在 HDInsight 群集中使用 Hadoop 或 Spark,也可以使用 Azure Data Lake 分析服务,它是对 Azure Data Lake Store 的补充。该服务将帮助您运行作业,有效查询存储在 Azure Data Lake 存储中的数据并生成输出结果。

关于Azure 数据湖 VS Azure HDInsight,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50679909/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com