标签: hazelcast-jet

Java: double min = logs.stream().min(new LogPojo.Comp()).get().getValue();

Spark: JavaRDD<LogPojo> logData = sc.parallelize(logs, num_partitions);
double min = logData.min(new LogPojo.Comp()).getValue();

Hazel: IStreamList<LogPojo> iLogs = jet.getList("logs");
iLogs.addAll(logs);
double min = iLogs.stream().min(new LogPojo.Comp()).get().getValue();

Flink: DataSet<LogPojo> logSet = env.fromCollection(logs);
double min = logSet.reduce(new LogReducer()).collect().get(0).getValue();

Run Code Online (Sandbox Code Playgroud)

我对此进行了广泛的测试，改变了测试列表的大小以及分配的资源。结果让我大吃一惊。最佳结果如下（所有数字以毫秒为单位，1 个 mio pojo，每个 10 个测试）：

实例：声明和启动框架实例需要多长时间
列表：解析/传输列表到框架“列表”需要多长时间
process：处理数据需要多长时间才能检索到最小值
总体：从每个测试的开始到结束

结果：

java:
Instances: 
List: 
Process: 37, 24, 16, 17, 16, 16, 16, 16, 16, 16, 
Overall: 111, 24, …

Run Code Online (Sandbox Code Playgroud)

java performance apache-spark apache-flink hazelcast-jet

And*_*ard

2017 03-16

3
推荐指数

1
解决办法

424
查看次数

是否可以在Hazelcast中加入两个不同的IMap？

我有两个hazelcast地图1. map2 2. map2

我想把两个地图都放在键上。

我可以在hazelcast中做吗？

谢谢

hazelcast hazelcast-imap hazelcast-jet

ani*_*has

lucky-day

1
推荐指数

1
解决办法

602
查看次数

将 [hazelcast-jet] 添加到现有应用程序

我有一个现有的应用程序，它使用 Hazelcast 来跟踪集群成员资格和分布式任务执行。我认为 Jet 可用于在现有应用程序之上添加分析，并且我正在尝试找出如何最好地将 Jet 分层到我们已有的应用程序之上。

所以我的第一个问题是，应该如何在我们现有的 Hazelcast 配置之上运行 Jet？我是否必须单独运行 Jet，或者用 Jet 替换我们现有的 Hazelcast 配置（因为 Jet 确实公开了 HazelcastInstance。）

我的第二个问题是，我看到很多使用 IMap 和 IList 的示例，但我没有看到任何使用主题作为来源的内容（我也不认为这是来源构建器中的一个选项）。我最初使用 Jet 的想法是将我们现有代码中的事件（io perf 数据、http 请求数据）发送到一个主题，然后让 Jet 处理该主题，从该数据生成分析，然后将其推送到 IMap。这是错误的方法吗？我应该使用其他结构将这些事件推送到 Jet 中吗？我看到我可以制作自己的自定义 Source，我可以在其中执行此操作，但我觉得如果我要追求这个，我一定走错了路，因为图书馆尚未为此特定目的提供一个。

hazelcast hazelcast-jet

Pat*_*mer

lucky-day

1
推荐指数

1
解决办法

83
查看次数