标签: distributed-system

当领导者提交日志条目并在通知追随者此承诺之前崩溃时，raft 如何保持安全？

根据我的理解，领导者向追随者发送 AppendEntries RPC，如果大多数追随者返回成功，领导者将提交此条目。它会通过将其应用到自己的状态机来提交此条目，并且还会返回给客户端，让客户端知道该命令已成功。

然而，目前，追随者还不知道这一承诺。它将在下一个 AppendEntries（或心跳）RPC 调用中通知关注者。

在最简单的情况下，如果leader在提交之后、下一个AppendEntries之前崩溃，raft将使用“只有最新的follower才能获胜”策略来确保下一个leader必须包含这个日志条目（尽管没有提交），新的领导者将提交该条目并将 AppendEntries 发送给其他追随者。这样，日志条目就可以安全保存。

然而，请考虑以下复杂的场景（摘自博士论文“共识：理论与实践的桥梁”第 23 页）。

此时，第 2 项的日志条目已复制到大多数服务器上，但尚未提交。如果 S1 如 (d1) 那样崩溃，S5 可以当选为领导者（通过 S2、S3 和 S4 的投票）并用第 3 期中自己的条目覆盖该条目。

如果此时在服务器 S1 中已提交，但在其他服务器中尚未提交怎么办？如果 S1 然后像 (d1) 那样崩溃，该日志条目将被 S5 覆盖吗？

根据我的理解，提交的条目（应用于状态机并可能通知客户端结果）永远不会被覆盖？

我是否误解了筏协议的任何内容？

谢谢。

distributed-computing distributed-system consensus raft

use*_*498

2020 12-11

6
推荐指数

1
解决办法

678
查看次数

Elasticsearch 和 CAP 定理

Elasticsearch 是一个分布式系统。根据 CAP 定理，它可以满足 3 个属性中的任意 2 个。Elasticsearch 中哪一个受到了威胁？

distributed-system elasticsearch cap-theorem

Dha*_*Sab

2020 12-19

6
推荐指数

2
解决办法

5224
查看次数

在分布式系统中学习有关通信更新的算法的最佳论文是什么？

我有一个分布式系统(单个数据中心中的多个节点),我想要具有以下属性:

节点可以随时进入和离开系统.
- 节点之间没有数据复制.
- 客户端使用哪个节点取决于客户端(即它可以是一致的散列,也可能是其他节点)
没有主人(即没有中心点的失败)
每个节点可以接收需要转发到其余节点的一条信息

什么算法(最适合论文的链接)适合这个？

(我假设一些答案将包括P2P算法,但我过去遇到的大部分答案都更像是分布式哈希表,其中节点进入并接管键空间的某些部分,等等.我也认识到使用简单UDP消息进行多播可能是合适的,但现有的工作有助于使消息传递可靠吗？)

p2p shared-nothing distributed-computing distributed-system

apg*_*apg

lucky-day

5
推荐指数

1
解决办法

374
查看次数

如何在运行Hadoop MapReduce作业时将文件名/文件内容作为MAP的键/值输入？

我正在创建一个分析PDF,DOC和DOCX文件的程序.这些文件存储在HDFS中.

当我启动MapReduce作业时,我希望map函数将Filename作为键,将Binary Contents作为值.然后我想创建一个流阅读器,我可以将其传递给PDF解析器库.如何实现Map Phase的键/值对是filename/filecontents？

我正在使用Hadoop 0.20.2

这是开始工作的旧代码:

public static void main(String[] args) throws Exception {
 JobConf conf = new JobConf(PdfReader.class);
 conf.setJobName("pdfreader");

 conf.setOutputKeyClass(Text.class);
 conf.setOutputValueClass(IntWritable.class);

 conf.setMapperClass(Map.class);
 conf.setReducerClass(Reduce.class);

 conf.setInputFormat(TextInputFormat.class);
 conf.setOutputFormat(TextOutputFormat.class);

 FileInputFormat.setInputPaths(conf, new Path(args[0]));
 FileOutputFormat.setOutputPath(conf, new Path(args[1]));

 JobClient.runJob(conf);
}

Run Code Online (Sandbox Code Playgroud)

我知道还有其他inputformat类型.但有没有一个完全符合我的要求？我觉得文档很模糊.如果有一个可用,那么Map函数输入类型应该如何？

提前致谢!

java hadoop mapreduce distributed-system

Chr*_*phe

lucky-day

5
推荐指数

1
解决办法

7064
查看次数

获取分布式系统中的节点数

我正在构建一个具有非结构化对等覆盖的分布式系统.该系统中可能有数千个节点.节点可以动态加入系统(如torrent客户端).在系统中,每个节点想要估计系统中的节点数(猜测近似值).

我目前正在使用集中式服务器来计算节点数.每个节点都与此服务器通信.这非常低效并且违反了分布式行为.

有没有办法在不使用集中式服务器的情况下以分布式方式执行此操作？

p2p distributed-system

Sam*_*age

lucky-day

5
推荐指数

1
解决办法

544
查看次数

Hadoop的分布式替代品

我有一个奇怪的问题。

什么是hadoop的一些分布式和可扩展的替代方案。我正在寻找像HDFS这样的分布式文件系统，该系统可以用作廉价而有效的存储，并希望在其之上具有数据处理引擎（批处理/实时）。我知道Spark可以是一个很好的选择。但是我想将此系统用作分布式，容错和可扩展的文件存档。是否有合适的解决方案？欢迎提出建议。谢谢：）

storage distributed hadoop distributed-system hdfs

Sac*_*hin

2016 08-17

5
推荐指数

1
解决办法

4050
查看次数