如何在Apache NiFi中处理具有相同名称的文件?

Siv*_*man 4 hadoop hdfs apache-nifi

我正在学习NiFi,我正在研究使用文件的流程,GetFile然后我做了一些处理,然后使用PutHDFS处理器将它们存储到HDFS中.问题是,我很可能会得到同名文件.例如,我可能每30分钟获取一个文件,并且每30分钟生成的文件将具有相同的名称.

现在,当我将该文件放入HDFS时,我得到一个"已存在同名文件".我该如何克服这个问题?有没有办法在运行时更改文件名?

Siv*_*man 6

这是一个非常简单的.我只需要使用UpdateAttribute处理器来更改文件名.例如:您可以附加timestamp到文件名.

UpdateProcessor,添加属性filename及其值${filename}.${now()}

  • 如果时间戳也可能有冲突的高速率,表达式语言也有UUID函数https://nifi.apache.org/docs/nifi-docs/html/expression-language-guide.html#uuid (4认同)