gpt4 book ai didi

azure - microsoft azure 集群和存储帐户之间的区别

转载 作者:行者123 更新时间:2023-12-01 13:46:03 24 4
gpt4 key购买 nike

我正在向this course学习。它要求创建一个新的 hdinsight 集群(选项有 hadoop、hbase、storm 或 Spark)以及一个存储帐户。集群和存储帐户有什么区别?集群是否包含处理我的作业的处理器,存储帐户是否意味着存储我的数据的空间?为什么我无法将同一个存储帐户连接到不同的集群?

还在 Microsoft Azure >> New >> Data + Analytics 下,我看到 2 个选项:hdinsight、处理大数据的数据湖分析。这两者有什么区别?两者看起来很相似

HDInsight微软基于云的大数据服务。 Apache Hadoop 和其他流行的大数据解决方案。

数据湖分析大数据分析变得简单

最佳答案

这里有很多问题,让我一一回答。

什么是 Blob 存储与 HDInsight 群集?Blob 存储是一种与 HDFS 非常相似的分布式文件存储,用于存储数据/视频/事物。 HDInsight 群集是为在 DFS(HDFS 或 Blob 存储)上运行 MapReduce 代码而创建的许多 Hadoop 虚拟机。拥有两个独立的服务可以让您独立扩展每个服务,从长远来看可以节省资金。数据存储很便宜,但 500 个节点的 VM 集群很快就会变得昂贵。能够终止集群但保留数据很有帮助。

为什么我无法将同一个存储帐户连接到不同的集群?您可以让多个集群指向同一个存储帐户,但这是一种反模式。存储帐户具有数据和 IO 限制,如果您有多个集群针对单个存储帐户进行拉取,则更有可能达到这些限制。此外,如果存储帐户中有数据,则只需花费 $$,因此拥有多个存储帐户不会增加成本。

什么是 Azure Data Lake(ADL) 和 ADL 存储?Azure 数据湖是存储和计算的另一种选择。 ADL 存储可以视为 blob 存储 v2。您可以提高 Blob 存储对 IO 和文件大小的一些限制,同时仍然能够使用 Hadoop 进行计算。 ADL 是与 Hadoop 完全不同的第二种计算选项。您不必担心集群创建或一般集群。您编写一个查询,指定您想要的并行化量,然后返回数据。

引用文献:

https://azure.microsoft.com/en-us/documentation/articles/azure-subscription-service-limits/#storage-limits

https://azure.microsoft.com/en-us/services/hdinsight/

https://azure.microsoft.com/en-us/solutions/data-lake/

关于azure - microsoft azure 集群和存储帐户之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36090130/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com