hadoop - 在 NFS 上安装 Hadoop-6ren

hadoop - 在 NFS 上安装 Hadoop

转载作者：可可西里更新时间：2023-11-01 16:17:49

作为开始，我安装了 Hadoop (0.15.2) 并设置了一个包含 3 个节点的集群:NameNode、DataNode 和 JobTracker 各一个。所有守护进程都已启动并正在运行。但是当我发出任何命令时，我都会收到上述错误。例如，当我执行 copyFromLocal 时，出现以下错误:

我错过了什么吗？

更多详情:我正在尝试在 NFS 文件系统上安装 Hadoop。我已经安装了 1.0.4 版本并尝试运行它但无济于事。 1.0.4 版本不启动数据节点。数据节点的日志文件是空的。因此，我切换回 0.15 版本，它至少启动了所有守护进程。

我认为问题是由于底层 NFS 文件系统造成的，即所有数据节点和主节点都使用相同的文件和文件夹。但我不确定是否真的如此。但我看不出有任何理由不能在 NFS 上运行 Hadoop(在适当设置配置参数后)。

目前我正在尝试并弄清楚是否可以根据各个机器名称为不同的机器设置不同的名称和数据目录。

配置文件:(hadoop-site.xml)

 <property>
 <name>fs.default.name</name>
 <value>mumble-12.cs.wisc.edu:9001</value>
 </property>
 <property>
 <name>mapred.job.tracker</name>
 <value>mumble-13.cs.wisc.edu:9001</value>
 </property>
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>
 <property>
 <name>dfs.secondary.info.port</name>
 <value>9002</value>
 </property>
 <property>
 <name>dfs.info.port</name>
 <value>9003</value>
 </property>
 <property>
 <name>mapred.job.tracker.info.port</name>
 <value>9004</value>
 </property>
 <property>
 <name>tasktracker.http.port</name>
 <value>9005</value>
 </property>

使用 Hadoop 1.0.4 时出错(DataNode 没有启动):

2013-04-22 18:50:50,438 INFO org.apache.hadoop.ipc.Server: IPC Server handler 7 on     9001, call addBlock(/tmp/hadoop-akshar/mapred/system/jobtracker.info, DFSClient_502734479, null) from 128.105.112.13:37204: error: java.io.IOException: File /tmp/hadoop-akshar/mapred/system/jobtracker.info could only be replicated to 0 nodes, instead of 1
java.io.IOException: File /tmp/hadoop-akshar/mapred/system/jobtracker.info could only be replicated to 0 nodes, instead of 1

使用 Hadoop 0.15.2 时出错:

[akshar@mumble-12] (38)$ bin/hadoop fs -copyFromLocal lib/junit-3.8.1.LICENSE.txt input

13/04/17 03:22:11 WARN fs.DFSClient: Error while writing.
java.net.SocketException: Connection reset
    at java.net.SocketInputStream.read(SocketInputStream.java:189)
    at java.net.SocketInputStream.read(SocketInputStream.java:121)
    at java.net.SocketInputStream.read(SocketInputStream.java:203)
    at java.io.DataInputStream.readShort(DataInputStream.java:312)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.endBlock(DFSClient.java:1660)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.close(DFSClient.java:1733)
    at org.apache.hadoop.fs.FSDataOutputStream$PositionCache.close(FSDataOutputStream.java:49)
    at org.apache.hadoop.fs.FSDataOutputStream.close(FSDataOutputStream.java:64)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:55)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:83)
    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:140)
    at org.apache.hadoop.fs.FileSystem.copyFromLocalFile(FileSystem.java:826)
    at org.apache.hadoop.fs.FsShell.copyFromLocal(FsShell.java:120)
    at org.apache.hadoop.fs.FsShell.run(FsShell.java:1360)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
    at org.apache.hadoop.fs.FsShell.main(FsShell.java:1478)
13/04/17 03:22:12 WARN fs.DFSClient: Error while writing.
java.net.SocketException: Connection reset
    at java.net.SocketInputStream.read(SocketInputStream.java:189)
    at java.net.SocketInputStream.read(SocketInputStream.java:121)
    at java.net.SocketInputStream.read(SocketInputStream.java:203)
    at java.io.DataInputStream.readShort(DataInputStream.java:312)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.endBlock(DFSClient.java:1660)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.close(DFSClient.java:1733)
    at org.apache.hadoop.fs.FSDataOutputStream$PositionCache.close(FSDataOutputStream.java:49)
    at org.apache.hadoop.fs.FSDataOutputStream.close(FSDataOutputStream.java:64)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:55)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:83)
    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:140)
    at org.apache.hadoop.fs.FileSystem.copyFromLocalFile(FileSystem.java:826)
    at org.apache.hadoop.fs.FsShell.copyFromLocal(FsShell.java:120)
    at org.apache.hadoop.fs.FsShell.run(FsShell.java:1360)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
    at org.apache.hadoop.fs.FsShell.main(FsShell.java:1478)
13/04/17 03:22:12 WARN fs.DFSClient: Error while writing.
java.net.SocketException: Connection reset
    at java.net.SocketInputStream.read(SocketInputStream.java:189)
    at java.net.SocketInputStream.read(SocketInputStream.java:121)
    at java.net.SocketInputStream.read(SocketInputStream.java:203)
    at java.io.DataInputStream.readShort(DataInputStream.java:312)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.endBlock(DFSClient.java:1660)
    at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.close(DFSClient.java:1733)
    at org.apache.hadoop.fs.FSDataOutputStream$PositionCache.close(FSDataOutputStream.java:49)
    at org.apache.hadoop.fs.FSDataOutputStream.close(FSDataOutputStream.java:64)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:55)
    at org.apache.hadoop.io.IOUtils.copyBytes(IOUtils.java:83)
    at org.apache.hadoop.fs.FileUtil.copy(FileUtil.java:140)
    at org.apache.hadoop.fs.FileSystem.copyFromLocalFile(FileSystem.java:826)
    at org.apache.hadoop.fs.FsShell.copyFromLocal(FsShell.java:120)
    at org.apache.hadoop.fs.FsShell.run(FsShell.java:1360)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
    at org.apache.hadoop.fs.FsShell.main(FsShell.java:1478)
copyFromLocal: Connection reset

最佳答案

我能够使用 1.1.2 版让 Hadoop 在 NFS 上运行。它可能适用于其他版本，但我不能保证任何事情。

如果您有一个 NFS 文件系统，那么每个节点都应该可以访问该文件系统。 fs.default.name 告诉 Hadoop 要使用的文件系统 URI，因此它应该指向本地磁盘。我假设您的 NFS 目录已安装到/nfs 中的每个节点。

在 core-site.xml 中你应该定义:

<property>
  <name>fs.default.name</name>
  <value>file:///</value>
</property>

<property>
  <name>hadoop.tmp.dir</name>
  <value>/nfs/tmp</value>
</property>

在 mapred-site.xml 中你应该定义:

<property>
  <name>mapred.job.tracker</name>
  <value>node1:8021</value>
</property>

<property>
  <name>mapred.local.dir</name>
  <value>/tmp/mapred-local</value>
</property>

由于 hadoop.tmp.dir 指向 nfs 驱动器，因此 mapred.system.dir 和 mapreduce.jobtracker.staging.root.dir 的默认位置指向 nfs 驱动器上的位置。它可能会在保留 mapred.local.dir 的默认值的情况下运行，但它应该指向本地文件系统，因此为了安全起见，您可以将其放在/tmp 中。

您不必担心 hdfs-site.xml。当您启动名称节点时会使用此配置文件，但由于所有内容都分布在 nfs 驱动器上，因此您不应该运行 HDFS。

现在您可以在 jobtracker 节点上运行 start-mapred.sh 并运行 hadoop 作业。不要运行 start-all.sh 或 start-dfs.sh，因为它们会启动 HDFS。如果您运行多个指向同一个 NFS 目录的 DataNode，那么一个 DataNode 将锁定该目录，而其他 DataNode 将关闭，因为它们无法获得锁定。

我测试了配置:

bin/hadoop jar hadoop-examples-1.1.2.jar wordcount /nfs/data/test.text /nfs/out

请注意，您需要指定输入和输出位置的完整路径。

我也试过:

bin/hadoop jar hadoop-examples-1.1.2.jar grep /nfs/data/loremIpsum.txt /nfs/out2 lorem

它给我的输出与我在 Standalone 中运行它时的输出相同，所以我认为它运行正常。

这里是关于 fs.default.name 的更多信息: http://www.greenplum.com/blog/dive-in/usage-and-quirks-of-fs-default-name-in-hadoop-filesystem

关于hadoop - 在 NFS 上安装 Hadoop，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16055279/

文章推荐： hadoop - 旧 Hadoop API 中的 Mapper.cleanup() 方法等效于什么？

文章推荐： c++ - Qt/Qml 和方法重载

文章推荐： c++ - 多重继承不明确的基类

文章推荐： hadoop - 在 Hadoop 中读取分布式文件

nfs - 如何在客户端上设置 NFS 共享配额或限制？
我正在运行 Debian GNU/Linux 7 VM mount.nfs 版本 mount.nfs: (linux nfs-utils 1.2.6) 我想在 NFS 挂载上设置配额。 NFS 服务器
centos - 在 CentOS vagrant 机器上安装 NFS 客户端时出现 "yum -y install nfs-utils nfs-utils-lib"
我正在尝试使用 VirtualBox 作为提供程序并使用 ansible 作为配置工具来“升级”一台 CentOS 机器 (centos7-x64-vbox43)。我执行了以下命令: vagrant
nfs - 使用 NFS 进行 inotify
我最近使用 inotify 创建了一个保管箱系统，监视在特定目录中创建的文件。我正在监视的目录是从 NFS 服务器挂载的，并且 inotify 的行为与我的预期不同。考虑以下场景，其中 inotify
java - NFS 客户端锁定当前正在远程 NFS 服务器中写入的文件
我已经在我的本地机器上安装了一个 NFS 挂载(所以，我想我的机器是 NFS 客户端)并且一个文件正在被托管 NFS 挂载的远程机器(NFS 服务器)写入 NFS 挂载中。现在，我如何使用 JAVA
storage - 挂载 NFS 驱动器是否占用 NFS 客户端空间？
我关注这个tutorial为我的服务器设置 NFS。目前，我有 1 台服务器将其部分目录共享为 HOST，2 台服务器将这些目录作为 CLIENT。我的问题很直接，如果我的HOST包含200万张图片
nfs - 使用带有 NFS 分区的 docker 卷
我在主机上有一个 NFS 分区，如果将其添加到容器中 docker run -i -t -v /srv/nfs4/dir:/mnt ubuntu /mnt 将包含共享数据，但它不会导致冲突吗？因为它还
NFS 服务器和 NFS 客户端的 Iptables 规则
没有 iptables 规则，我可以挂载我的 NFSSERVER:/PATH 但有了它(firewall/iptables) 已启用，但我无法安装。 [.e.g., after iptables --
linux - 跟踪多个数据中心的 nfs/sync nfs 变化
我们有两个数据中心，每个数据中心都有许多共享一个基于 EMC 的大型 nfs 的 Linux 服务器。挑战在于保持两个 nfs 同步。目前假设写入仅发生在 nfs1 上，然后 nfs1 必须将更改传
WSL 下的 NFS 客户端 - mount.nfs : No such device
我在尝试挂载 nfs 导出时遇到以下错误。 sudo mount 192.168.1.175:/mnt/nas /mnt/c/nas mount.nfs: No such device 关于如何解
mount.nfs : requested NFS version or transport protocol is not supported
NFS 挂载在我的 RHEL 7 AWS 实例中不起作用。当我做一个 mount -o nfsvers=3 10.10.11.10:/ndvp2 /root/mountme2/ 我得到错误: mou
vagrant - 输出 : mount. nfs:不支持请求的 NFS 版本或传输协议(protocol)
我正在复制 Controller 示例 [1] 中尝试 Kubernetes NFS 卷声明。我已经设置了 NFS 服务器、PV 和 PVC。我的复制 Controller 看起来像这样 apiVe
linux - 我可以设置一个 debian nfs 服务器并拥有一个 fedora nfs 客户端吗？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
linux - 如何为用户查找文件和目录并排除 NFS 挂载和 NFS 挂载的符号链接(symbolic link)？
我想查找并更改用户帐户及其在本地文件系统上的默认组，但不包括大量 NFS 安装和指向这些安装的符号链接(symbolic link)。我尝试了多种语法但没有成功 - find / -user dumm
macos - Docker 中的 NFS : exportfs: does not support NFS export
我正在使用 docker NFS 容器，但是在安装导出的目录(即使在本地主机上)时遇到了麻烦。问题 exportfs: does not support NFS export 设置我的容器使用入
hadoop - HDFS NFS 网关 mount.nfs : Input/output error?
HDFS NFS GateWay mount.nfs:输入/输出错误？ 1.报错如下: [root@xx sbin]# mount -t nfs -o vers=3,proto=tcp,nolock,
nfs - 创建 Docker Swarm v1.12.3 服务并挂载 NFS 卷
我无法为 Docker Swarm 安装 NFS 卷，并且缺乏有关 --mount 语法( https://docs.docker.com/engine/reference/commandline/s
kubernetes - NFS-PV、NFS 上的 hostPath-PV 和部署中的 hostPath 挂载之间的区别
我有一个 Kubernetes 集群设置(本地)，它有一个 NFS 共享(my-nfs.internal.tld)安装到 /exports/backup在每个节点上创建备份。现在我正在设置我的日志记
linux - sqlite 在 tcl 脚本中通过 nfs 使用(或者..如何制作可以在 nfs 上运行的独立 sqlite3)
我想将 sqlite 数据库嵌入到现有的 tcl 应用程序中(从平面文件迁移)。目前；我们的 tcl 解释器是从网络位置运行的； /bin/tclsh8.3 我有一个 nfs $PATH对于已经为所
linux - nfs 错误 : NFS:v4 server does not accept raw uid gids reenabling the idmapper
我在一台服务器上为客户端创建了一个 NFS 共享服务器和客户端都是centos 6系统。服务器 nfs 导出:/srv/diskless/tmp *(rw,sync,no_root_squash)。
ubuntu-9.10 - ubuntu 9.10 上的 nfs 客户端，/etc/init.d/nfs-common 不存在
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 10 个月前关闭。 Improve

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

hadoop - 在 NFS 上安装 Hadoop