hadoop - 如何在Hadoop中设置NameNodes、DataNodes、Mappers和Reducers的数量-6ren

hadoop - 如何在Hadoop中设置NameNodes、DataNodes、Mappers和Reducers的数量

转载作者：可可西里更新时间：2023-11-01 15:27:54

27

4

我想知道如何设置数量

NameNode

数据节点

映射器

reducer

在 Hadoop 的代码/配置中。

最佳答案

Namenode 和 DataNode 数量 由您的业务需求决定。您无需通过编程来设置它们。

如果您需要可伸缩性，则必须了解 HDFS 联邦的概念。

请参阅此文档 page有关联邦的更多详细信息。

In order to scale the name service horizontally, federation uses multiple independent Namenodes/namespaces. The Namenodes are federated; the Namenodes are independent and do not require coordination with each other. The Datanodes are used as common storage for blocks by all the Namenodes.

映射器的数量由输入拆分决定。

您可以通过编程方式设置reducer 数量，但 framwork 没有义务遵守您的建议。

因此，最好让 Hadoop 决定 Mappers 和 Reducers 的数量。

编辑:

Hadoop 集群大小:1. 根据您的业务需求确定数据需求2. 确定数据的复制因子3.计算 future 几年的数据爆炸率4. 有了以上数据后，您就可以考虑 Namenode 和 Datanode 的理想集群大小和硬件要求。

引用这个cloudera article更多细节。

The right level of parallelism for maps seems to be around 10-100 maps per-node" node here means NameNode or DataNode?

它是数据节点。

when talking about Mappers some says same number as splits, another says same number of blocks, while others say it is determined by the framework

它是由 hadoop 框架根据输入拆分的数量决定的。

查看相关的 SE 问题:

How does Hadoop perform input splits?

关于hadoop - 如何在Hadoop中设置NameNodes、DataNodes、Mappers和Reducers的数量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40828615/

27

4

0

文章推荐： http - 从浏览器发送http PUT/GET/DELETE/POST请求

文章推荐： vb.net - VB.Net 中的 HTTP 文件服务器(130 行代码)

文章推荐： ruby-on-rails-3 - 在 Rails 3 应用程序中解析 JSON HTTP 帖子？

文章推荐： hadoop - HDFS - 名称节点未启动

java - 调用失败的org.apache.hadoop.hdfs.server.datanode.DataNode
我在简单的两台机器hadoop集群中面临以下错误。 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException
hadoop - 错误:找不到或加载主类org.apache.hadoop.hdfs.server.datanode.DataNode
我有Hadoop 2.7.1 e，它可以成功运行。接下来，我下载了apache-hive-2.1.1-bin，并编辑了“.bashrc”文件以更新用户的环境变量。现在，当我使用命令“* / sbin
hadoop - 启动 start-dfs.sh 时无法启动 datanode 并且 datanode 的文件权限正在更改
我在将本地文件部署到 hdfs 时遇到问题，发现我应该为数据节点和名称节点设置“drwx------”。hdfs中datanode和namenode的初始权限状态。 drwx------ 3 hdus
hadoop - 错误 org.apache.hadoop.hdfs.server.datanode.DataNode : RECEIVED SIGNAL 15: SIGTERM
在我的主节点中运行 Hive 查询时，我遇到了一些严重的问题。我有 3 个集群设置(1 个名称节点，2 个数据节点)。版本: Hadoop:2.7.3 hive :2.1.0 Java:openjd
java - 错误 : Could not find or load main class org. apache.hadoop.hdfs.server.datanode.DataNode
我是 apache hadoop 的新手。我正在安装多节点集群，但出现两个错误。我不知道这些是什么类型的错误以及它们产生的原因。我在谷歌上搜索了很多关于这些错误的信息，但我无法找出错误产生背后的原因。
Hadoop Kerberos : Datanode cannot connect to Namenode. 由 jsvc 启动 Datanode 以绑定(bind)特权端口(不使用 SASL)
我设置了一个运行良好的 HA Hadoop 集群。但是添加Kerberos认证后datanode无法连接namenode。验证 Namenode 服务器成功启动并且没有记录错误。我用用户 'hdus
hadoop - 错误org.apache.hadoop.hdfs.server.datanode.DataNode:java.io.IOException:本地异常调用本地/127.0.0.1:54310失败
在启动计算机上设置的单节点集群时，启动数据节点时出现错误 ************************************************************/ 2013-0
hadoop - datanode DataNode失败的卷上出现致命磁盘错误:
我在我的namenode上收到以下日志并将其从执行中删除我的datanode 2013-02-08 03:25:54,345 WARN namenode.NameNode (NameNodeRpcS
java - 无法正常启动hadoop datanode
我之前已经成功启动了datanode，但是当我今天尝试时，它显示了以下信息。听起来我还没有mkdir / home / hadoop / appdata / hadoopdata目录，但是我确认该目录
Hadoop Datanode 未启动
目前，我已经在我的 Ubuntu 系统中安装了 Hadoop。我开始了。以下是详细信息: krish@krish-VirtualBox:~$ start-dfs.sh 20 年 14 月 10 日 1
hadoop - Datanode HBase和NameNode没有启动hortonworks
我收到连接拒绝错误即使我拥有正确的权限，我的名称节点和数据节点也无法启动。服务给出以下错误:(连接失败:[Errno 111]连接被拒绝到0.0.0.0:50010)。最佳答案可能是因为您没有配置
hadoop datanode 机架感知设置
我正在构建一个 hadoop 集群。我有 3 个机架，每个机架包含几个虚拟机。如何配置hadoop让它有rack awareness？有人建议使用“topology.script.file.name”
Hadoop:datanode 进程正在运行但不工作？
这几天一直在尝试安装hadoop集群。有时成功，但大多数时候失败。我根据官方文档和一些貌似高质量的博客进行了配置。我遇到的问题是:所有进程(包括namenode、datanode、nodemanag
hadoop - DataNode 未在任何节点上启动
当我使用伪节点配置时，所有守护进程都在启动，但任何时候我创建一个完全分布式模式的集群时，DataNode 守护进程都不会在任何节点上启动，包括主节点。可能导致此行为的原因是什么？最佳答案确保 n
hadoop - 无法正常启动hadoop datanode
我正在尝试安装 hadoop 2.2.0，但在启动 dataenode 服务时出现以下错误，请帮助我解决此问题。在此先致谢。 2014-03-11 08:48:16,406 信息 org.apache
hadoop - Datanode 无法正常启动
我正在尝试以伪分布式模式安装 Hadoop 2.2.0。当我尝试启动数据节点服务时显示以下错误，谁能告诉我如何解决这个问题？ **2**014-03-11 08:48:15,916 INFO org.
hadoop - 没有显示Namenode Datanode ResourceManager等
在给出命令jps时: 它只显示 some _pid jps 没有显示别人喜欢的服务 Namenode Datanode ResourceManager etc 最佳答案您是否已启动服务。如果服务
hadoop - Hadoop Datanode Xcievers错误
我已经使用HDFS API构建了一个存储系统。我现在正在对系统进行一些性能测试。我通过SIEGE创建了大量并发文件检索请求(例如:siege -c 500 -r 1 "http://bucket1.s
java - Datanode + VM初始化期间发生错误初始堆太小
我们重新启动集群上的数据节点我们在 ambari 集群中有 15 台数据节点机器而每台datanode机器有128G RAM 版本 -(HDP - 2.6.4 和 ambari 版本 2.6.1)
hadoop - Hadoop/Datanode 目录下当前和以前目录的意义
Hadoop/Datanode 目录下当前和以前的目录有什么意义？ hadoop 如何使用它们？我在本地文件系统的所有磁盘上的路径/hadoop/datanode 下有一个/current 目录。

首页

博学

6Ren·AI

商城

hadoop - 如何在Hadoop中设置NameNodes、DataNodes、Mappers和Reducers的数量