gpt4 book ai didi

hadoop - 亚马逊 AWS 上的区域服务器数量

转载 作者:可可西里 更新时间:2023-11-01 16:16:44 25 4
gpt4 key购买 nike

假设我在 Amazon elastic mapreduce 上启动了一个集群,并且有一个主节点实例、2 个核心节点实例和 15 个任务节点实例。

我想我使用 mapreduce 作业和增量上传将大约 1 TB 的数据上传到 hbase。

现在 -

  1. 如何找到表大小和区域拆分(字节)。通常在 CDH 上我会做一个 hadoop fs -du/hbase。但是我的master节点上没有/hbase目录。

  2. 我也很想知道区域服务器分配将如何运作。因此,即使我有 100 个区域(如果我有 1 个主节点),这也意味着整个 IO 都会受到限制吗?

谢谢问候

最佳答案

您是否使用 Elastic Map Reduce 在 Amazon AWS 中启动了 HBase 集群?或者只是一个 Hadoop 集群?

  1. “hadoop fs -du/hbase”在 HBase-on-EMR 上对我有用。你能仔细检查一下吗?
  2. 如果您没有预分割区域等,HBase 会为您处理这些。至于 I/O 限制,请查看 HBase 文档/视频 - 当客户端需要从 HBase 读取/写入时,它将缓存来自 -ROOT- 和 .META 的结果。并直接联系区域服务器,而不是通过主服务器。

关于hadoop - 亚马逊 AWS 上的区域服务器数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19156259/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com