- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我想知道如何设置数量
NameNode
数据节点
映射器
reducer
在 Hadoop 的代码/配置中。
最佳答案
Namenode 和 DataNode 数量 由您的业务需求决定。您无需通过编程来设置它们。
如果您需要可伸缩性,则必须了解 HDFS 联邦的概念。
请参阅此文档 page有关联邦的更多详细信息。
In order to scale the name service horizontally, federation uses multiple independent Namenodes/namespaces. The Namenodes are federated; the Namenodes are independent and do not require coordination with each other. The Datanodes are used as common storage for blocks by all the Namenodes.
映射器的数量由输入拆分决定。
您可以通过编程方式设置reducer 数量,但 framwork 没有义务遵守您的建议。
因此,最好让 Hadoop 决定 Mappers 和 Reducers 的数量。
看看这个相关的 SE 问题:
How hadoop decides how many nodes will do map and reduce tasks
编辑:
Hadoop 集群大小:1. 根据您的业务需求确定数据需求2. 确定数据的复制因子3.计算 future 几年的数据爆炸率4. 有了以上数据后,您就可以考虑 Namenode 和 Datanode 的理想集群大小和硬件要求。
引用这个cloudera article更多细节。
The right level of parallelism for maps seems to be around 10-100 maps per-node" node here means NameNode or DataNode?
它是数据节点。
when talking about Mappers some says same number as splits, another says same number of blocks, while others say it is determined by the framework
它是由 hadoop 框架根据输入拆分的数量决定的。
查看相关的 SE 问题:
关于hadoop - 如何在Hadoop中设置NameNodes、DataNodes、Mappers和Reducers的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40828615/
我在简单的两台机器hadoop集群中面临以下错误。 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException
我有Hadoop 2.7.1 e,它可以成功运行。接下来,我下载了apache-hive-2.1.1-bin,并编辑了“.bashrc”文件以更新用户的环境变量。现在,当我使用命令“* / sbin
我在将本地文件部署到 hdfs 时遇到问题,发现我应该为数据节点和名称节点设置“drwx------”。hdfs中datanode和namenode的初始权限状态。 drwx------ 3 hdus
在我的主节点中运行 Hive 查询时,我遇到了一些严重的问题。我有 3 个集群设置(1 个名称节点,2 个数据节点)。 版本: Hadoop:2.7.3 hive :2.1.0 Java:openjd
我是 apache hadoop 的新手。我正在安装多节点集群,但出现两个错误。我不知道这些是什么类型的错误以及它们产生的原因。我在谷歌上搜索了很多关于这些错误的信息,但我无法找出错误产生背后的原因。
我设置了一个运行良好的 HA Hadoop 集群。但是添加Kerberos认证后datanode无法连接namenode。 验证 Namenode 服务器成功启动并且没有记录错误。我用用户 'hdus
在启动计算机上设置的单节点集群时,启动数据节点时出现错误 ************************************************************/ 2013-0
我在我的namenode上收到以下日志并将其从执行中删除我的datanode 2013-02-08 03:25:54,345 WARN namenode.NameNode (NameNodeRpcS
我之前已经成功启动了datanode,但是当我今天尝试时,它显示了以下信息。听起来我还没有mkdir / home / hadoop / appdata / hadoopdata目录,但是我确认该目录
目前,我已经在我的 Ubuntu 系统中安装了 Hadoop。我开始了。以下是详细信息: krish@krish-VirtualBox:~$ start-dfs.sh 20 年 14 月 10 日 1
我收到连接拒绝错误即使我拥有正确的权限,我的名称节点和数据节点也无法启动。服务给出以下错误:(连接失败:[Errno 111]连接被拒绝到0.0.0.0:50010)。 最佳答案 可能是因为您没有配置
我正在构建一个 hadoop 集群。我有 3 个机架,每个机架包含几个虚拟机。如何配置hadoop让它有rack awareness?有人建议使用“topology.script.file.name”
这几天一直在尝试安装hadoop集群。有时成功,但大多数时候失败。我根据官方文档和一些貌似高质量的博客进行了配置。 我遇到的问题是:所有进程(包括namenode、datanode、nodemanag
当我使用伪节点配置时,所有守护进程都在启动,但任何时候我创建一个完全分布式模式的集群时,DataNode 守护进程都不会在任何节点上启动,包括主节点。 可能导致此行为的原因是什么? 最佳答案 确保 n
我正在尝试安装 hadoop 2.2.0,但在启动 dataenode 服务时出现以下错误,请帮助我解决此问题。在此先致谢。 2014-03-11 08:48:16,406 信息 org.apache
我正在尝试以伪分布式模式安装 Hadoop 2.2.0。当我尝试启动数据节点服务时显示以下错误,谁能告诉我如何解决这个问题? **2**014-03-11 08:48:15,916 INFO org.
在给出命令jps时: 它只显示 some _pid jps 没有显示别人喜欢的服务 Namenode Datanode ResourceManager etc 最佳答案 您是否已启动服务。如果服务
我已经使用HDFS API构建了一个存储系统。我现在正在对系统进行一些性能测试。我通过SIEGE创建了大量并发文件检索请求(例如:siege -c 500 -r 1 "http://bucket1.s
我们重新启动集群上的数据节点 我们在 ambari 集群中有 15 台数据节点机器而每台datanode机器有128G RAM 版本 -(HDP - 2.6.4 和 ambari 版本 2.6.1)
Hadoop/Datanode 目录下当前和以前的目录有什么意义? hadoop 如何使用它们? 我在本地文件系统的所有磁盘上的路径/hadoop/datanode 下有一个/current 目录。
我是一名优秀的程序员,十分优秀!