如何在pentaho中循环获取文件名?

Cyn*_*ure 4 pentaho kettle

我有100 000个文件.我想得到那些文件名的名称,并且必须放入数据库,我必须这样做

  1. 得到10个文件名;
  2. 更新/插入名称到数据库; 和
  3. 将这10个文件移动到另一个目录; 并循环这三个步骤,直到找不到文件.

这可能吗?

Mil*_*los 6

我附上了一个工作示例(我在水壶4.3上测试了大约400个文本文件.).

transformation.ktr job.kjb

转换和工作都包含有关设置内容和位置的详细说明.

  • Transformation.ktr它从给定的源文件夹中读取前10个文件名,为文件移动创建目标文件路径.它输出文件名以插入/更新(我使用虚拟步骤作为占位符)并使用"将行复制到结果集"来输出文件移动所需的源和目标路径.
  • job.kjb所有循环都在这个工作中完成.它执行"transformation.ktr"(插入/更新10个文件),然后将这10个文件移动到目标文件夹.之后,它会检查源文件夹中是否还有其他文件.如果有,则重复进程,如果没有,则声明成功.