分布式,同步批处理

sch*_*cho 5 java distributed-computing batch-processing akka

在我们当前的Java项目中,我们需要批量处理大量记录.完成此处理后,必须再次启动并再次处理所有记录.该处理必须并行化并且在多个节点之间分布.

记录本身存储在数据库中.使用一些id范围(例如1-10000)来识别批次就足够了.

从高层面来看,我看到以下步骤:

子任务处理一批记录.
主任务检查是否有任何子任务仍在运行.如果没有,请为每批记录创建一个子任务.

我们非常重视MongoDB,并考虑将子任务保存在其中.然后,每个节点都可以获取尚未完成的子任务,进行处理并将记录标记为已完成.一旦没有撤消的子任务,主任务将再次创建所有子任务.这可能会奏效,但我们正在寻找一种解决方案,我们不需要自己进行繁重的同步工作.

这可能是akka的一个可能的用例吗？
是否可以使用akka-persistence来同步不同节点之间的处理？
是否有适合此工作的其他Java/JVM框架？

归档时间：	8 年，7 月前
查看次数：	713 次
最近记录：	8 年，7 月前

在Java中更改Import的名称,或导入两个具有相同名称的类 335

迭代器和迭代之间有什么区别以及如何使用它们？ 178

Java中hashCode的用途是什么？ 145

按字母顺序比较字符串 89

"最后100个字节"采访场景 78

将RGB颜色值转换为十六进制字符串 76

Map的keySet()和entrySet()的性能注意事项 74

Hibernate,iBatis,Java EE或其他Java ORM工具 66

如何在Java 7 java.nio.file.Path中访问子文件/文件夹？ 60

如何在X时间后杀死一名Akka演员？ 1

检测未定义的对象属性 2742

在Windows命令行上是否有相应的"哪个"？ 2231

如何在macOS或OS X上安装pip？ 1676

在JavaScript中生成两个数字之间的随机数 1635

如何在Javascript中的数组开头添加新的数组元素？ 1476

如何设置HTML <select>元素的默认值？ 1343

如何在JavaScript中合并两个数组并重复删除项目 1256

"this"关键字如何运作？ 1243

如何在Vim中移动到行尾？ 1140

删除目录的符号链接 1063