gpt4 book ai didi

hadoop - 如何从 HDFS 运行 pig 脚本?

转载 作者:可可西里 更新时间:2023-11-01 15:26:27 25 4
gpt4 key购买 nike

我正在尝试从 hdfs 运行 pig 脚本,但它显示错误,因为该文件不存在。

我的 hdfs 目录

[cloudera@quickstart ~]$ hdfs dfs -ls /
Found 11 items
drwxrwxrwx - hdfs supergroup 0 2016-08-10 14:35 /benchmarks
drwxr-xr-x - hbase supergroup 0 2017-08-19 23:51 /hbase
drwxr-xr-x - cloudera supergroup 0 2017-07-13 04:53 /home
drwxr-xr-x - cloudera supergroup 0 2017-08-27 07:26 /input
drwxr-xr-x - cloudera supergroup 0 2017-07-30 14:30 /output
drwxr-xr-x - solr solr 0 2016-08-10 14:37 /solr
-rw-r--r-- 1 cloudera supergroup 273 2017-08-27 11:59 /success.pig
-rw-r--r-- 1 cloudera supergroup 273 2017-08-27 12:04 /success.script
drwxrwxrwt - hdfs supergroup 0 2017-08-27 12:07 /tmp
drwxr-xr-x - hdfs supergroup 0 2016-09-28 09:00 /user
drwxr-xr-x - hdfs supergroup 0 2016-08-10 14:37 /var

执行的命令

[cloudera@quickstart ~]$ pig -x mapreduce /success.pig 

错误信息

log4j:WARN No appenders could be found for logger (org.apache.hadoop.util.Shell).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
2017-08-27 12:34:39,160 [main] INFO org.apache.pig.Main - Apache Pig version 0.12.0-cdh5.8.0 (rexported) compiled Jun 16 2016, 12:40:41
2017-08-27 12:34:39,162 [main] INFO org.apache.pig.Main - Logging error messages to: /home/cloudera/pig_1503862479069.log
2017-08-27 12:34:47,079 [main] ERROR org.apache.pig.Main - ERROR 2997: Encountered IOException. File /success.pig does not exist
Details at logfile: /home/cloudera/pig_1503862479069.log

我错过了什么?

最佳答案

您可以使用 -f <script location>用于运行位于 HDFS 路径的脚本的选项和选项值。但脚本位置必须是绝对路径,如以下语法和示例所示。

Syntax: 
pig -f <fs.defaultFS>/<script path in hdfs>

Example:
pig -f hdfs://Foton/user/root/script.pig

关于hadoop - 如何从 HDFS 运行 pig 脚本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45908636/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com