通过Oozie命令行重新运行工作流时,有几个选项.
选项1工作正常,但是,在使用选项2重新运行工作流时,它会引发错误E0404.
oozie job -oozie http://<url>/oozie -Doozie.wf.rerun.skip.nodes=node1,node2 -rerun WFID
错误:E0404:E0404:只允许其中一个属性[oozie.wf.rerun.skip.nodes OR oozie.wf.rerun.failnodes]
但是,下面的工作正常.
oozie job -oozie http://<url>/oozie -Doozie.wf.rerun.failnodes=true -rerun WFID
我们希望根据数据可用性安排工作流程,但没有特定的数据到达频率。此外,可能会有多个数据重新运行,因此一天中的任何时间都有数据的多个版本。
从规范中可以了解到,目前必须在协调器中指定频率参数。
但是,我们只想根据某些事件(数据到达或分区创建)来触发我们的工作流,而不依赖于频率。
看来这符合异步数据集的条件。Oozie是否支持异步数据集?