gpt4 book ai didi

hadoop - 如何部署和运行 oozie 作业?

转载 作者:可可西里 更新时间:2023-11-01 14:11:59 27 4
gpt4 key购买 nike

我正在尝试使用 oozie 做一个简单的工作。
这将是一个简单的 Pig Action。

我有一个文件:FirstScript.pig 包含:

dual = LOAD 'default.dual' USING org.apache.hcatalog.pig.HCatLoader();
store dual into 'dummy_file.txt' using PigStorage();

和一个 workflow.xml 包含:

<workflow-app name="FirstWorkFlow" xmlns="uri:oozie:workflow:0.2">
<start to="FirstJob"/>
<action name="FirstJob">
<pig>
<job-tracker>hadoop:50300</job-tracker>
<name-node>hdfs://hadoop:8020</name-node>
<script>/FirstScript.pig</script>
</pig>
<ok to="okjob"/>
<error to="errorjob"/>
</action>
<ok name='okjob'>
<message>job OK, message[${wf:errorMessage()}]</message>
</ok>
<error name='errorjob'>
<message>job error, error message[${wf:errorMessage()}]</message>
</error>
</workflow-app>

我已经创建了结构:

FirstScript
|- lib
|---FirstScript.pig
|- workflow.xml

然后呢?我如何部署它并与 oozie 一起运行?
有经验的可以帮忙吗?

问候
帕维尔

最佳答案

我是这样做的:

hadoop fs -put workflow.xml some_dir/ 
oozie job --oozie http://your_host:11000/oozie -config cluster_conf.xml -run

我的 cluster_conf.xml 看起来像这样(请先检查您的端口,它们依赖于 Hadoop 发行版):

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<configuration>
<property>
<name>nameNode</name>
<value>hdfs://my_nn:8020</value>
</property>
<property>
<name>jobTracker</name>
<value>my_jt:8050</value>
</property>
<property>
<name>oozie.wf.application.path</name>
<value>/user/my_user/some_dir/workflow.xml</value>
</property>
</configuration>

关于hadoop - 如何部署和运行 oozie 作业?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21458792/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com