przepływ pracy może wyglądać tak ...
workflow.xml
<workflow-app xmlns="uri:oozie:workflow:0.2" name="hive-wf">
<start to="hive-node"/>
<action name="hive-node">
<hive xmlns="uri:oozie:hive-action:0.2">
<job-tracker>localhost:50001</job-tracker>
<name-node>hdfs://localhost:50000</name-node>
<configuration>
<property>
<name>mapred.job.queue.name</name>
<value>default</value>
</property>
<property>
<name>oozie.hive.defaults</name>
<value>/user/user1/oozie/hive-site.xml</value>
</property>
</configuration>
<script>script.q</script>
<param>INPUT_TABLE=SampleTable</param>
<param>OUTPUT=/user/user1/output-data/hive</param>
</hive>
<ok to="end"/>
<error to="fail"/>
</action>
<kill name="fail">
<message>Hive failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
</kill>
<end name="end"/>
</workflow-app>
Więc ula-site.xml jest xml witryny obecne w $ HIVE_HOME/conf folderu.
plik script.q zawiera rzeczywiste zapytanie o ula. select * from ${INPUT_TABLE}
.
jak i gdzie możemy użyć parametru OUTPUT?
przetłumaczenie na oozie oznacza, czy chcesz mieć plik workflow.xml do wykonania zadania harmonogramu uruchamiającego instrukcje dotyczące tej gałęzi dla każdej godziny? – WR10
Tak, dokładnie to chcę osiągnąć, ale jak wygląda plik workflow.xml? – nickponline
Aby to zrobić, możesz potrzebować trzech kroków. 1. Plik workflow.xml do wykonania dla zadania w ulu. 2. Skrypt powłoki do wykonania przepływu pracy oozie. 3. Zadanie cron zaplanować uruchamianie skryptu powłoki okresowo dla każdej godziny. – WR10