小编Maz*_*ine的帖子

Spark 1.6 (RPC) 的可扩展性更好：Netty 或 AKKA？

Spark 1.6 可以配置为使用 AKKA 或 Netty 进行 RPC。如果配置了 Netty，这是否意味着 Spark 运行时不使用 Actor 模型进行消息传递（例如，在工作程序和驱动程序块管理器之间），或者甚至在 Netty 配置的情况下，依赖于 Netty 使用自定义简化的 Actor 模型。

我认为 AKKA 本身依赖于 netty，而 Spark 仅使用 AKKA 的一个子集。不过，与 Netty 相比，配置 AKKA 是否更具有可扩展性（就工作人员数量而言）？对这个特定的火花配置有什么建议吗？

rpc akka netty apache-spark

Maz*_*ine

2016 12-26

5
推荐指数

1
解决办法

1142
查看次数

普罗米修斯中的速率函数之和

给定以下称为requests的普罗米修斯时间序列：

矢量查询请求[3秒]是：

向量查询请求的速率[3秒]，速率（请求[3秒]）（由所示公式计算）为：

我的问题是：在第 5、4 和 3 秒计算的sum(rate(requests[3 sec]))分别是 16.5、6.5 和 1。有什么想法吗？

prometheus prometheus-operator prometheus-alertmanager prometheus-node-exporter prometheus-blackbox-exporter

Maz*_*ine

lucky-day

5
推荐指数

1
解决办法

2万
查看次数

Kafka增量粘性再平衡

我使用 Kafka Strimzi 运算符在 Kubernetes 上运行 Kafka。我通过使用以下内容配置我的消费者来使用增量粘性重新平衡策略：

ConsumerConfig.PARTITION_ASSIGNMENT_STRATEGY_CONFIG,
      org.apache.kafka.clients.consumer.CooperativeStickyAssignor.class.getName()

Run Code Online (Sandbox Code Playgroud)

每次我扩展消费者组中的消费者时，该组中的所有现有消费者都会生成以下异常

线程“main”中出现异常 org.apache.kafka.common.errors.RebalanceInProgressException：由于使用者正在进行自动分区分配的重新平衡，因此无法完成偏移提交。您可以尝试通过调用 poll() 来完成重新平衡，然后重试该操作

知道导致此异常的原因和/或如何解决它吗？

谢谢。

apache-kafka kubernetes kafka-consumer-api strimzi

Maz*_*ine

lucky-day

5
推荐指数

1
解决办法

4824
查看次数

Apache Flink 中的端到端 Exactly-once 处理

Apache Flink 通过从检查点恢复作业来保证故障时的一次性处理和恢复，检查点是分布式数据流和算子状态的一致快照（分布式快照的 Chandy-Lamport 算法）。 这保证了故障转移时恰好一次。

在集群正常运行的情况下，Flink 如何保证一次处理，例如给定一个从外部源（比如 Kafka）读取的 Flink 源，Flink 如何保证事件从源读取一次？事件源和 Flink 源之间是否存在任何类型的应用程序级别确认？另外，Flink 如何保证事件从上游算子到下游算子只传播一次？这是否也需要对收到的事件进行任何类型的确认？

apache-kafka apache-flink flink-streaming exactly-once

Maz*_*ine

lucky-day

3
推荐指数

1
解决办法

2091
查看次数