gpt4 book ai didi

hadoop - 配置环境。 RStudio 的变量 HADOOP_STREAMING

转载 作者:可可西里 更新时间:2023-11-01 15:14:55 28 4
gpt4 key购买 nike

我已经在 Horton Hadoop 上安装了 RStudio 3.1。

目前我的 Hadoop Streaming 环境变量是使用此路径设置的 导出 HADOOP_STREAMING=/usr/lib/hadoop-mapreduce/hadoop-streaming.jar

我在使用 RStudio 执行简单的 mapreduce 时遇到错误

hadoop.streaming() 中的错误: 请确保环境。变量 HADOOP_STREAMING 已设置

谁能告诉我 hadoop-streaming jar 文件的正确路径是什么?谢谢。

最佳答案

这取决于你在哪里安装了你的 hadoop 库,例如,如果你使用的是 cloudera 发行版,你可以在 R 中使用以下内容:

Sys.setenv(HADOOP_STREAMING = "/opt/cloudera/parcels/CDH-5.1.3-1.cdh5.1.3.p0.12/lib/hadoop-mapreduce/hadoop-streaming.jar")

关于hadoop - 配置环境。 RStudio 的变量 HADOOP_STREAMING,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26028155/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com