gpt4 book ai didi

R 没有连接到 HDFS

转载 作者:可可西里 更新时间:2023-11-01 15:05:36 24 4
gpt4 key购买 nike

为什么 R 没有连接到 Hadoop?

我正在使用 R 通过“rhdfs”包连接到 HDFS。安装“rJava”包并加载 rhdfs 包。

HADOOP_CMD 环境变量在 R 中使用:

Sys.setenv(HADOOP_CMD='/usr/local/hadoop/bin')

但是当给出hdfs.init()函数时,会产生如下错误信息:

sh: 1: /usr/local/hadoop/bin: Permission denied
Error in .jnew("org/apache/hadoop/conf/Configuration") :
java.lang.ClassNotFoundException
In addition: Warning message:
running command '/usr/local/hadoop/bin classpath' had status 126

此外,'rmr2' 库已加载,并键入以下代码:

ints = to.dfs(1:100)

生成下面给出的消息:

sh: 1: /usr/local/hadoop/bin: Permission denied

R-Hadoop 包只能由“root”用户访问,而不能由“hduser”(Hadoop 用户)访问,因为它们是在“root”用户运行 R 时安装的。

最佳答案

很简单,只有两个原因会导致出现此类问题

1) 路径错误2)没有那个 jar 的特权/许可不仅包括其他系统路径。如下所示。

Sys.setenv(HADOOP_HOME="/home/hadoop/path")

Sys.setenv(HADOOP_CMD="/home/hadoop/path/bin/hadoop")

Sys.setenv(HADOOP_STREAMING="/home/hadoop/path/streaming-jar-file.jar")

Sys.setenv(JAVA_HOME="/home/hadoop/java/path")

然后包括 ibrary(rmr2) 和 library(rhdfs) 路径,肯定不会发生错误。

但是你的问题是权限问题。因此,作为 root 授予您所有权限 (755),然后运行该 jar 文件,肯定不会显示该错误。

关于R 没有连接到 HDFS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29658894/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com