gpt4 book ai didi

hadoop - Dumbo mapreduce for hadoop

转载 作者:行者123 更新时间:2023-12-02 21:40:54 26 4
gpt4 key购买 nike

我正在尝试在hadoop群集上运行Dumbo MapReduce命令,但收到以下错误。

15/03/02 17:55:28错误stream.StreamJob:作业不成功。错误:不适用
15/03/02 17:55:28信息流.StreamJob:killJob ...
流命令失败!

似乎我需要提供Hadoop流jar的路径。
我如何找到这个,什么是Hadoop流媒体jar?

我的dumbo命令如下:

dumbo start test_dumbo6.py -hadoop / apps / hadoop / -input /storage/user/jj/json.log -output ipcounts2

最佳答案

Hadoop Streaming上的文档:http://hadoop.apache.org/docs/r1.2.1/streaming.html

Hadoop流是hadoop核心的一部分,因此应在$ Hadoop_HOME / lib目录中可用。

该库可以通过添加其他参数添加到您的工作中:

-libjar <path_to_jar>

关于hadoop - Dumbo mapreduce for hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28816799/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com