标签: fault-tolerance

class A extends Actor with ActorLogging {
  override val supervisorStrategy = OneForOneStrategy(maxNrOfRetries = 2) { 
    case _ => log.info("An actor has been killed"); Restart 
  }

  val b = context.system.actorOf(Props[B], "b")

  def receive = {
    case _ => context.system.scheduler.schedule(5 seconds, 5 seconds, b, true)
  }
}

class B extends Actor with ActorLogging {
  def receive = { case true => self ! Kill }
}

Run Code Online (Sandbox Code Playgroud)

在self ! Kill演员的一个实例中,A我没有看到消息"一个演员已被杀死",随后对演员的调用会A生成"死信"消息,因此没有重启.为什么OneForOneStrategy不被叫？

奇怪的是,我可以删除整个OneForOneStrategy覆盖,并且程序行为没有任何变化.

scala fault-tolerance actor akka

src*_*091

2014 03-28

3
推荐指数

1
解决办法

1531
查看次数

HP/Tandem NonStop如何在没有备件的情况下实现单故障FT？

至于我可以从维基百科和令人难以置信的HPE网站收集,NonStop系统架构声名鹊起,它可以实现单故障FT,而无需分配过多的备用容量(即,通常采用锁步架构需要过度提供3倍).

这似乎是一个理想的属性,但我找不到有关他们使用的方法和警告的更多细节.即他们对网络做出的假设是什么,他们容忍的失败类型,假设客户行为,可接受的恢复时间,他们运行的工作流程等等.

任何人都可以简要描述一下NonStop系统如何解决故障检测和故障纠正的典型问题？它是系统级别的通用神奇解决方案,还是要求编写应用程序以使用某些事务工具和检查点数据和通信？

非常感谢!

fault-tolerance tandem hp-nonstop

ddi*_*rov

lucky-day

3
推荐指数

1
解决办法

285
查看次数

Zookeeper 容错究竟是什么意思？同时或累积？

正如 ZooKeeper Getting Started Guide 中提到的，容错集群设置至少需要三台服务器，强烈建议您使用奇数台服务器。

因此，如果我有 5 个服务器，并且如上所述，当其中 2 个失败时，我仍然可以生存。但这意味着同时或累积？

那么这个怎么样：
5台服务器 -> 一台失败 -> 4 台服务器 -> 一台失败 -> 3 台服务器 -> 一台失败 -> 2 台服务器 -> 一台失败 -> 死

3台服务器有什么区别？初始化？和 3 个服务器（从 5 个服务器退化）？？

fault-tolerance apache-zookeeper

duk*_*kyz

lucky-day

3
推荐指数

1
解决办法

655
查看次数

最后抛出的Exception如何包含先前抛出的异常？

抛出的最后一个异常如何包含java中之前抛出的所有异常？

我从失败安全异常处理中读取失败安全异常处理,我无法理解这一点"一种方法是确保抛出的最后一个异常包含所有先前抛出的异常." 我们怎样才能做到这一点？

java oop fault-tolerance exception stack-trace

Gov*_*pta

2015 02-27

2
推荐指数

1
解决办法

468
查看次数

发生异常时未调用 MPI 错误处理程序

在过去的几天里，我一直在尝试使用 MPI 用 C 语言编写容错应用程序。我正在尝试学习如何将错误处理程序附加到 MPI_COMM_WORLD 通信器，以便在节点出现故障（可能是由于崩溃）的情况下并退出而不调用 MPI_Finalize() 程序仍然可以从这种情况中恢复并继续计算。

到目前为止，我遇到的问题是，在我将错误处理程序函数附加到通信并导致节点崩溃后，MPI 不会调用错误处理程序，而是强制所有线程退出。

我认为这可能是我的应用程序的问题，所以我在线查找示例代码并尝试运行它，但情况是相同的...我当前尝试运行的示例代码如下。（我从这里得到https://www.google.co.uk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CC4QFjAA&url=http%3A%2F%2Fwww.shodor.org% 2Fmedia%2Fcontent%2F%2Fpetascale%2Fmaterials%2FdistributedMemory%2Fpresentations%2FMPI_Error_Example.pdf&ei=jq6KUv-BBcO30QW1oYGABg&usg=AFQjCNFa5L_Q6Irg3VrJ3fsQBIyqjBlSgA&sig2=8An4SqBvhCACx5YLwB mROA对 PDF 格式表示歉意，但它不是我写的，所以我现在粘贴下面相同的代码）：

/* Template for creating a custom error handler for MPI and a simple program 
to demonstrate its' use. How much additional information you can obtain 
is determined by the MPI binding in use at build/run time. 

To illustrate that the program works correctly use -np 2 through -np 4.

To illustrate an MPI error set victim_mpi = 5 and use -np 6. …

Run Code Online (Sandbox Code Playgroud)

c fault-tolerance mpi

And*_* AG

2013 11-20

2
推荐指数

1
解决办法

3259
查看次数