hadoop - DataNode 和 TaskTracker 在不同的机器上？

转载作者：可可西里更新时间：2023-11-01 16:26:03

26

4

我是 Hadoop 的新手，我有以下关于 Hadoop 框架的问题。有人可以指导吗？

DataNode 和 TaskTracker 是否物理上位于生产环境中的不同机器上？
Hadoop 何时将文件拆分为 block ？当您将文件从本地文件系统复制到 HDFS 时会发生这种情况吗？

最佳答案

简答

大部分时间，但不一定。
是。

长答案

1)

在集群上安装 Hadoop 将有 2 种主要类型的节点:

主节点
数据节点

主节点通常至少运行:

CLDB
动物园管理员
工作追踪器

数据节点通常至少运行:

任务追踪器

The DataNode service can run on a different node than the TaskTracker service .然而，Hadoop Docs对于 DataNode 服务，建议在相同节点上运行 DataNode 和 TaskTracker 以便 MapReduce操作靠近数据执行。

对于MapR Hadoop 的分布，这两个服务器角色通常运行:

MapR 控制节点
- 动物园管理员 *
- CLDB *
- 工作追踪器 *
- HBaseMaster
- NFS 网关
- 网络服务器
MapR 数据节点
- 任务跟踪器 *
- RegionServer(有时)
- 动物园管理员(有时)

2)

虽然大多数文件系统以 block 的形式存储数据，HDFS在 DataNodes 中分发和复制 block 。当您第一次将数据存储在 HDFS 中时，它会将数据分成 block 并根据指定的复制因子将其存储在不同的节点上。但是，如果您向集群添加新的 DataNode，它会 will not automatically rebalance old blocks across them除非不满足复制因子。

(感谢@javadba 澄清了这一点!)

关于hadoop - DataNode 和 TaskTracker 在不同的机器上？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27497734/

26

4

0

文章推荐： asp.net - asp.net如何实现301永久重定向

文章推荐： c++ - C++中的字符串切片

文章推荐： c++ - gcc 会根据条件优化我的循环吗？

文章推荐： java - 创建一个接受多种参数类型的通用函数

java - 调用失败的org.apache.hadoop.hdfs.server.datanode.DataNode
我在简单的两台机器hadoop集群中面临以下错误。 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException
hadoop - 错误:找不到或加载主类org.apache.hadoop.hdfs.server.datanode.DataNode
我有Hadoop 2.7.1 e，它可以成功运行。接下来，我下载了apache-hive-2.1.1-bin，并编辑了“.bashrc”文件以更新用户的环境变量。现在，当我使用命令“* / sbin
hadoop - 启动 start-dfs.sh 时无法启动 datanode 并且 datanode 的文件权限正在更改
我在将本地文件部署到 hdfs 时遇到问题，发现我应该为数据节点和名称节点设置“drwx------”。hdfs中datanode和namenode的初始权限状态。 drwx------ 3 hdus
hadoop - 错误 org.apache.hadoop.hdfs.server.datanode.DataNode : RECEIVED SIGNAL 15: SIGTERM
在我的主节点中运行 Hive 查询时，我遇到了一些严重的问题。我有 3 个集群设置(1 个名称节点，2 个数据节点)。版本: Hadoop:2.7.3 hive :2.1.0 Java:openjd
java - 错误 : Could not find or load main class org. apache.hadoop.hdfs.server.datanode.DataNode
我是 apache hadoop 的新手。我正在安装多节点集群，但出现两个错误。我不知道这些是什么类型的错误以及它们产生的原因。我在谷歌上搜索了很多关于这些错误的信息，但我无法找出错误产生背后的原因。
Hadoop Kerberos : Datanode cannot connect to Namenode. 由 jsvc 启动 Datanode 以绑定(bind)特权端口(不使用 SASL)
我设置了一个运行良好的 HA Hadoop 集群。但是添加Kerberos认证后datanode无法连接namenode。验证 Namenode 服务器成功启动并且没有记录错误。我用用户 'hdus
hadoop - 错误org.apache.hadoop.hdfs.server.datanode.DataNode:java.io.IOException:本地异常调用本地/127.0.0.1:54310失败
在启动计算机上设置的单节点集群时，启动数据节点时出现错误 ************************************************************/ 2013-0
hadoop - datanode DataNode失败的卷上出现致命磁盘错误:
我在我的namenode上收到以下日志并将其从执行中删除我的datanode 2013-02-08 03:25:54,345 WARN namenode.NameNode (NameNodeRpcS
java - 无法正常启动hadoop datanode
我之前已经成功启动了datanode，但是当我今天尝试时，它显示了以下信息。听起来我还没有mkdir / home / hadoop / appdata / hadoopdata目录，但是我确认该目录
Hadoop Datanode 未启动
目前，我已经在我的 Ubuntu 系统中安装了 Hadoop。我开始了。以下是详细信息: krish@krish-VirtualBox:~$ start-dfs.sh 20 年 14 月 10 日 1
hadoop - Datanode HBase和NameNode没有启动hortonworks
我收到连接拒绝错误即使我拥有正确的权限，我的名称节点和数据节点也无法启动。服务给出以下错误:(连接失败:[Errno 111]连接被拒绝到0.0.0.0:50010)。最佳答案可能是因为您没有配置
hadoop datanode 机架感知设置
我正在构建一个 hadoop 集群。我有 3 个机架，每个机架包含几个虚拟机。如何配置hadoop让它有rack awareness？有人建议使用“topology.script.file.name”
Hadoop:datanode 进程正在运行但不工作？
这几天一直在尝试安装hadoop集群。有时成功，但大多数时候失败。我根据官方文档和一些貌似高质量的博客进行了配置。我遇到的问题是:所有进程(包括namenode、datanode、nodemanag
hadoop - DataNode 未在任何节点上启动
当我使用伪节点配置时，所有守护进程都在启动，但任何时候我创建一个完全分布式模式的集群时，DataNode 守护进程都不会在任何节点上启动，包括主节点。可能导致此行为的原因是什么？最佳答案确保 n
hadoop - 无法正常启动hadoop datanode
我正在尝试安装 hadoop 2.2.0，但在启动 dataenode 服务时出现以下错误，请帮助我解决此问题。在此先致谢。 2014-03-11 08:48:16,406 信息 org.apache
hadoop - Datanode 无法正常启动
我正在尝试以伪分布式模式安装 Hadoop 2.2.0。当我尝试启动数据节点服务时显示以下错误，谁能告诉我如何解决这个问题？ **2**014-03-11 08:48:15,916 INFO org.
hadoop - 没有显示Namenode Datanode ResourceManager等
在给出命令jps时: 它只显示 some _pid jps 没有显示别人喜欢的服务 Namenode Datanode ResourceManager etc 最佳答案您是否已启动服务。如果服务
hadoop - Hadoop Datanode Xcievers错误
我已经使用HDFS API构建了一个存储系统。我现在正在对系统进行一些性能测试。我通过SIEGE创建了大量并发文件检索请求(例如:siege -c 500 -r 1 "http://bucket1.s
java - Datanode + VM初始化期间发生错误初始堆太小
我们重新启动集群上的数据节点我们在 ambari 集群中有 15 台数据节点机器而每台datanode机器有128G RAM 版本 -(HDP - 2.6.4 和 ambari 版本 2.6.1)
hadoop - Hadoop/Datanode 目录下当前和以前目录的意义
Hadoop/Datanode 目录下当前和以前的目录有什么意义？ hadoop 如何使用它们？我在本地文件系统的所有磁盘上的路径/hadoop/datanode 下有一个/current 目录。

首页

博学

6Ren·AI

商城

hadoop - DataNode 和 TaskTracker 在不同的机器上？

简答

长答案

1)

2)