gpt4 book ai didi

Hadoop:datanode 进程正在运行但不工作?

转载 作者:可可西里 更新时间:2023-11-01 14:51:40 31 4
gpt4 key购买 nike

这几天一直在尝试安装hadoop集群。有时成功,但大多数时候失败。我根据官方文档和一些貌似高质量的博客进行了配置。

我遇到的问题是:所有进程(包括namenode、datanode、nodemanager、resourcemanager)可以通过命令查看:jps

但奴隶们实际上并没有工作。我在 Web 界面 master:8088 或 master:50070 中看不到它们

有人说是重复的namenode格式和id冲突造成的。我认为这不是我的问题,因为数据节点从一开始就不起作用,而且数据节点文件夹始终是空的。

这种现象还有其他可能的原因吗?我真的很难设置集群。

详细信息:

Hadoop版本:3.0.0-alpha2

hdfs dfsadmin -report 的输出是:

Configured Capacity: 492017770496 (458.23 GB)
Present Capacity: 461047037952 (429.38 GB)
DFS Remaining: 460770820096 (429.13 GB)
DFS Used: 276217856 (263.42 MB)
DFS Used%: 0.06%
Under replicated blocks: 10069
Blocks with corrupt replicas: 0
Missing blocks: 0
Missing blocks (with replication factor 1): 0
Pending deletion blocks: 0

-------------------------------------------------
Live datanodes (1):

Name: 127.0.0.1:9866 (localhost)
Hostname: sr145.local.lan
Decommission Status : Normal
Configured Capacity: 492017770496 (458.23 GB)
DFS Used: 276217856 (263.42 MB)
Non DFS Used: 5954019328 (5.55 GB)
DFS Remaining: 460770820096 (429.13 GB)
DFS Used%: 0.06%
DFS Remaining%: 93.65%
Configured Cache Capacity: 0 (0 B)
Cache Used: 0 (0 B)
Cache Remaining: 0 (0 B)
Cache Used%: 100.00%
Cache Remaining%: 0.00%
Xceivers: 1
Last contact: Sun Jan 02 02:52:57 CST 2000

**唯一一个存活的数据节点是主节点的同一个节点。**所有其他从节点都不存活。

配置细节:1、hdfs-site.xml:

<configuration>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>sr145:9001</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/opt/hadoop/hdfs/namenode</value>
</property>

<property>
<name>dfs.datanode.data.dir</name>
<value>file:/opt/hadoop/hdfs/datanode</value>
</property>
</configuration>

2、核心站点.xml

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/opt/hadoop/tmp</value>
<description>Abasefor other temporary directories.</description>
</property>

</configuration>

3、yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.manager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>sr145</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>sr145:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>sr145:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>sr145:8035</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>sr145:8033</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>sr145:8088</value>
</property>
</configuration>

所有节点的配置几乎相同,只是hdfs-site.xml natenode或datanode配置不同。$HADOOP_HOME/etc/hadoop 中的workersslaves 文件也被编辑。与原始状态相比,没有文件被移动。

最佳答案

The only one live datanode is the same node of master node.

只有该数据节点知道名称节点绑定(bind)到 localhost,所有其他数据节点都在尝试连接 sr145

fs.defaultFS 中设置的主机值是 Namenode 守护程序将启动的位置。
在主节点中将其设置为localhost 使进程绑定(bind)到节点的环回IP。编辑该值以具有实际的主机名或 IP 地址,在本例中为

<property>
<name>fs.defaultFS</name>
<value>hdfs://sr145:9000</value>
</property>

此属性在所有节点中必须相同。

关于Hadoop:datanode 进程正在运行但不工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43486599/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com