java - 集群重启后 Namenode 卡在 SAFEMODE-6ren

java - 集群重启后 Namenode 卡在 SAFEMODE

转载作者：可可西里更新时间：2023-11-01 14:56:07

26

4

我设置了3 节点 Hadoop 集群(Apache Hadoop-2.8.0)。我已经部署了 2 个使用 QJM 在 HA 模式下配置的名称节点。在安装namenode的同一台机器上配置了2个datanodes。第三个节点仅用于仲裁目的。

Setup  
Node1 { nn1, dn1, jn1, zkfc1, zkServer1 }  
Node2 -> {nn2, dn2, jn2, zkfc2, zkServer2}  
Node3 -> {jn3,  zkServer3}

我出于某种原因停止了集群(重新启动服务器)并且因为它们我无法成功启动集群。检查日志后，我发现名称节点处于安全模式，并且它们都无法将 block 加载到内存中。以下是名称节点 UI 中名称节点的状态。

Safe mode is ON. The reported blocks 0 needs additional 6132675 blocks to reach the threshold 0.9990 of total blocks 6138814. The number of live datanodes 0 has reached the minimum number 0. Safe mode will be turned off automatically once the thresholds have been reached. 61,56,984 files and directories, 61,38,814 blocks = 1,22,95,798 total filesystem object(s). Heap Memory used 5.6 GB of 7.12 GB Heap Memory. Max Heap Memory is 13.33 GB. Non Heap Memory used 45.19 MB of 49.75 MB Committed Non Heap Memory. Max Non Heap Memory is 130 MB.

名称节点日志中有许多 JVM Pause 消息，因此我尝试增加 HADOOP_HEAPSIZE，增加 HADOOP_NAMENODE_OPTS 中的堆大小，但没有成功。

需要帮助..

最佳答案

在收到 hadoop 用户邮件列表的回复后，我已经解决了这个问题。该问题是由于数据节点未生成 block 报告。我检查了日志，发现数据节点提示 ipc.maximum.data.length 小于要求。

我在 core-site.xml 文件中添加了以下属性来解决对我有用的问题。

<property>
     <name>ipc.maximum.data.length</name>
     <value>101372499</value>
 </property>

关于java - 集群重启后 Namenode 卡在 SAFEMODE，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45206389/

26

4

0

文章推荐： hadoop - 如何将所有收集的推文提取到一个文件中

文章推荐：黑莓上重叠的 HTML 表格单元格

文章推荐： hadoop - Hive - 或条件与左外连接

hadoop - NameNode 和辅助 Namenode
如果所有 Namenode 都发生故障，Secondary namenode 的作用是什么？最佳答案在开始之前，我将解释一下 NN 和 SNN 的作用。 NameNode: 它包含数据节点的元数据
hadoop - 错误配置 : namenode address dfs. namenode.servicerpc-address 或 dfs.namenode.rpc-address 没有配置
我正在尝试在 ec2-instance 上安装 Hadoop-2.6.0。我下载并安装了 Hadoop。我还设置了环境变量。尝试启动 hdfs 服务时出现以下错误。 [ec2-user@ip-10-
hadoop - namenode.NameNode : Could not initialize shared edits dir
您好，我在 HA 集群配置时间遇到了所有这些错误。请帮助我哪里错了。 14/09/08 11:13:38 INFO namenode.AclConfigFlag: ACLs enabled? fals
hadoop - 没有要停止的 Namenode 或 Datanode 或 Secondary NameNode
我按照以下链接中的步骤在我的 Ubuntu 12.04 中安装了 Hadoop。 http://www.bogotobogo.com/Hadoop/BigData_hadoop_Install_on_
hadoop - 配置不正确 : namenode address dfs. namenode.rpc-address没有配置
当我尝试启动 DataNode 时出现此错误。据我所知，RPC 参数仅用于 HA 配置，我没有设置(我认为)。 2014-05-18 18:05:00,589 INFO [main] impl.Me
macos - 无法找到或加载类 : org. apache.hadoop.hdfs.server.namenode.NameNode
我在我的mac上安装了hadoop，我按照hadoop安装一步一步来当我执行hdfs namenode -format hadoop 总是返回错误无法找到或加载类 org.apache.hadoo
hadoop - 无法找到或加载主类 org.apache.hadoop.hdfs.server.namenode.Namenode
我知道之前有人问过这个问题，但我想不出解决方案。当我尝试运行 hdfs name node -format 时出现以下错误: Could not find or load main class org
Hadoop Dedoop 应用程序无法联系 Hadoop Namenode : Getting "Unable to contact Namenode" error
我正在尝试使用在 Amazon EC2 上使用 Hadoop 和 HDFS 运行的 Dedoop 应用程序。 Hadoop 集群设置完毕，Namenode JobTracker 和所有其他守护进程都在
Hadoop Datanode、namenode、secondary-namenode、job-tracker 和 task-tracker
我是hadoop的新手，所以我有一些疑问。如果主节点发生故障，hadoop 集群会发生什么？我们能否在没有任何损失的情况下恢复该节点？是否可以保留一个辅助主节点在当前主节点发生故障时自动切换为主节点？
hadoop - hadoop datanode启动失败-错误的配置:未配置namenode地址dfs.namenode.servicerpc-address或dfs.namenode.rpc-address
我试图用一个namenode和两个datanode(slave1和slave2)设置Hadoop Cluster，所以我从Apache Hadoop下载了zip文件，并将其解压缩到namenode和d
hadoop - dfs.namenode.servicerpc-address 或 dfs.namenode.rpc-address 未配置
我试图用一个名称节点和四个数据节点配置 hadoop。我能够在一台机器上成功配置名称节点和作业跟踪器并将其启动。但是在我要配置数据节点的机器上，我做了以下操作: 我将 hadoop-2.0.0-cd
linux - hadoop namenode 不是以 "sbin/start-dfs.sh"开头，而是以 "bin/hadoop namenode"开头(尽管没有显示错误)
如果我运行: sbin/start-dfs.sh 然后它实际上并没有启动一个名称节点尽管打印: Starting namenodes on [0.0.0.0] 0.0.0.0: starting na
Hadoop 2.9.0 - hadoop namenode -format 和 hdfs-site.xml dfs.namenode.name.dir
我的第一个问题，我会尽量不把事情搞砸:) 出于学习目的，我正在 4 节点集群上安装 Hadoop 2.9.0。我已经按照官方 Apache Hadoop 2.9.0 文档和一些谷歌页面开始安装/配置名
Hadoop 2.7.2 - 错误 : Could not find or load main class org. apache.hadoop.hdfs.server.namenode.NameNode
我是新手，我正在尝试找到解决这个问题的方法。为了在 Ubuntu 15.10 上设置 Hadoop 2.7.2 http://idroot.net/tutorials/how-to-install-a
Hadoop 名称节点无法在 OSX 上运行(错误 org.apache.hadoop.hdfs.server.namenode.NameNode : java.net.SocketException:权限被拒绝)
我在 OSX(单节点集群模式)上运行 Hadoop 1.2.1，除了 namenode 之外，一切似乎都在工作:当我运行 start-all.sh 时，namenode 无法运行。这个可以在运行sto
188、故障排除和调试HBase：NameNode
NameNode 有关NameNode的更多信息，请参阅HDFS。表和区域的HDFS利用率要确定HBase在HDFS上使用的空间大小，请使用NameNode中的hadoop shell命令。
hadoop - namenode -format删除hdfs中的文件
我通过sqoop命令将数据从mysql成功上传到HDFS。 MySQL Hadoop集群有 1个名称节点 1个用于次要NameNode的节点 Jobtracker的1个节点 3个用于Datanade
java - Namenode 恶魔启动时挂断
我在配置 core-site.xml 文件中将端口更改为 9000 on 5000 并启动了一个脚本 ./hadoop namenode 结果我收到了以下消息(我只给出了从屏幕上看到的部分，因为在日志
hadoop - NameNode 未以伪分布式模式启动
我无法在 hadoop fs -ls/命令上查看我的 HDFS 中的文件，我认为这是因为名称节点未运行。我已尝试格式化名称节点以及更改核心站点中的端口.xml 到不同的值。我的 JPS 仍然没有列出
hadoop - Namenode 守护进程没有正常启动
我刚刚开始从 Hadoop:权威指南一书中学习 hadoop。我按照伪分发模式下的 Hadoop 安装教程进行操作。我启用了 ssh 的无密码登录。在第一次使用之前格式化 hdfs 文件系统。第一

首页

博学

6Ren·AI

商城

java - 集群重启后 Namenode 卡在 SAFEMODE