gpt4 book ai didi

hadoop - 一起安装 HBase + Hadoop 与分别安装 HBase 和 Hadoop 有什么优缺点?

转载 作者:可可西里 更新时间:2023-11-01 15:40:01 24 4
gpt4 key购买 nike

我的意思是,2 个选项:1.在Hadoop集群上安装HBase,也是做离线计算,也就是说只有1个hadoop集群。2.安装一个Hadoop Cluster for Offline Computing,然后再安装一个Hadoop Cluster,只供HBase使用其HDFS。

所以 2 个选项是:一个是集成集群,另一个实际上是 2 个集群。

这两个选项的优缺点是什么?

最佳答案

选项 1:集成集群。

优点:读取或写入 HBase 的 MapReduce 作为数据局部性会更高效。

缺点:HBase 区域服务器会降低机器(Datanode 和 TaskTracker)的性能,因为它需要占用一些 CPU 和内存。如果有很多 MapReduce 作业,HBase 延迟可能是秒。所以如果想让HBase及时响应,还需要做更多的工作(比如使用memcache提高读性能)。

选项 2:2 个集群。

优点:HBase 区域服务器不会影响 HDFS Datenode 和 TaskTracker 的性能。

缺点:MapReduce访问HBase需要远程读写数据。该选项还需要更多机器。

关于hadoop - 一起安装 HBase + Hadoop 与分别安装 HBase 和 Hadoop 有什么优缺点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17583408/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com