oozie:文件和存档标签的用法和差异?

Ani*_*ora 5 hadoop oozie

在 oozie 模式中,java 操作有两个标签: File 和 Archive 。

<xs:element name="file" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>
<xs:element name="archive" type="xs:string" minOccurs="0" maxOccurs="unbounded"/>

我想了解它们的用法?我还注意到这两个标签也适用于 MR/pig 操作。

小智 -1

关于文件和存档标签的快速描述:

file&元素archive可用于映射缩减作业、文件和档案。如果指定的路径是相对路径,则假定文件或归档程序位于应用程序目录中相应的子路径中。如果路径是绝对路径,则文件或存档应位于给定的绝对路径中。

使用该元素指定的文件<file>将成为任务主目录中的符号链接。

如果文件是本机库(“.so”或“.so.#”文件),它将在任务运行目录中符号链接为“.so”文件,从而可供任务 JVM 使用。

要强制任务运行目录上的文件使用符号链接,请使用“#”后跟符号链接名称。例如“mycat.sh#cat”。

有关任何 oozie 相关文档的更多信息,请单击链接 https://oozie.apache.org/docs/3.3.1/WorkflowFunctionalSpec.html#a3.2_Workflow_Action_Nodes