标签: distributed

分布式时间同步和Web应用程序

我目前正在尝试构建一个本质上需要跨服务器和每个客户端进行良好时间同步的应用程序.我的应用程序有替代设计可以消除这种同步需求,但是当我的应用程序不存在时,我的应用程序很快就会开始吮吸.

如果我遗漏了一些东西,我的基本问题是:在同一时刻在多个地点发起一个事件.我能说的最好,这样做的唯一方法就是需要某种时间同步,但我可能错了.我尝试过以不同方式对问题进行建模,但这一切都回到了a)一个糟糕的应用程序,或者b)需要时间同步.

让我们假设我真的需要同步时间.

我的应用程序基于Google AppEngine构建.虽然AppEngine不保证其服务器上的时间同步状态,但通常它是非常好的,大约几秒钟(即优于NTP),但是有时它会糟糕地说,比如大约10秒钟同步我的应用程序可以处理2-3秒不同步,但10秒对于用户体验是不可能的.所以基本上,我选择的服务器平台没有提供非常可靠的时间概念.

我的应用程序的客户端部分是用JavaScript编写的.我们再次遇到客户端没有可靠的时间概念的情况.我没有做任何测量,但我完全期望我的一些最终用户拥有设置为1901,1970,2024等的计算机时钟.基本上,我的客户端平台没有提供可靠的时间概念.

这个问题开始让我有点生气.到目前为止,我能想到的最好的事情就是在HTTP之上实现像NTP这样的东西(这并不像听起来那么疯狂).这可以通过在因特网的不同部分中调试2或3个服务器来工作,并且使用传统方式(PTP,NTP)来尝试确保它们的同步至少在几百毫秒的量级.

然后,我将创建一个JavaScript类,该类使用这些HTTP时间源(以及可从XMLHTTPRequest获得的相关往返信息)实现NTP交集算法.

正如你所知,这个解决方案也很糟糕.它不仅非常复杂,而且只能解决问题的一半,即为客户提供当前时间的良好概念.然后,我必须在服务器上妥协,或者允许客户端在发出请求时根据它们告诉服务器当前时间(大安全性禁止,但我可以减轻一些更明显的滥用此行为),或让服务器向我的一个神奇的HTTP-over-NTP服务器发出单个请求,并希望该请求足够快地完成.

这些解决方案都很糟糕,我迷失了.

提醒:我想要一堆Web浏览器,希望多达100个或更多,能够在同一时间触发事件.

time distributed synchronization

dmw*_*dmw

2009 01-11

9
推荐指数

1
解决办法

3362
查看次数

书籍请求:分布式算法

大家好.我想学习分布式算法,所以我正在寻找任何书籍推荐.我对理论书籍更感兴趣,因为实现只是品味的问题(我将使用erlang(或c#)).但另一方面,我不想要原始的,数学的算法分析.只是这个想法是如何工作的,以及为什么它的工作原理.

algorithm parallel-processing distributed

zio*_*666

2010 06-23

9
推荐指数

3
解决办法

2559
查看次数

用于计算括号平衡的分布式算法

这是一个采访问题:"如何构建分布式算法来计算括号的平衡？"

通常他的平衡算法从左到右扫描一个字符串形式,并使用一个堆栈来确保开括号的数量总是> =闭括号的数量,最后是开括号的数量==近括号的数量.

你会如何分发它？

algorithm distributed

Mic*_*ael

lucky-day

9
推荐指数

1
解决办法

3839
查看次数

P2P应用如何找到其他节点？

我想知道在分散的P2P网络中每个节点如何找到其他节点......

networking distributed p2p

Uma*_*mil

lucky-day

9
推荐指数

1
解决办法

4020
查看次数

检测Galera集群DB(mysql)中的更改.实现应用程序缓存失效

我想为使用Galera集群(mysql)作为DB的分布式应用程序添加缓存.每个应用程序节点(java)都有一个本地缓存,用于读取和与数据库节点通信.

问题是当集群中的另一个节点修改了条目时,我不知道如何使缓存中的条目无效.
我的第一次尝试是使用数据库触发器,但我很快就意识到复制更新不会引发触发器.
其他想法是监视网络流量搜索修改或观看DB的binlog,但它们似乎都很难实现.

问题是:是否有任何实用的方法来检测复制中来自另一个节点的变化？
实现缓存失效的其他想法？

我想我也可以使用通过应用程序节点传递更改的分布式缓存,但我更喜欢在每个应用程序节点中使用隔离缓存,并将节点之间的数据同步委托给数据库集群.我认为缓存通信是冗余的网络流量......

提前致谢.

java mysql distributed caching galera

fon*_*kap

lucky-day

9
推荐指数

1
解决办法

190
查看次数

分布式互相关矩阵计算

如何以分布式方式计算大(> 10TB)数据集的皮尔森互相关矩阵？任何有效的分布式算法建议将不胜感激.

更新:我读了apache spark mlib相关的实现

Pearson Computaation:
/home/d066537/codespark/spark/mllib/src/main/scala/org/apache/spark/mllib/stat/correlation/Correlation.scala
Covariance Computation:
/home/d066537/codespark/spark/mllib/src/main/scala/org/apache/spark/mllib/linalg/distributed/RowMatrix.scala

Run Code Online (Sandbox Code Playgroud)

但对我来说,看起来所有的计算都发生在一个节点上,而且它并没有真正意义上的分布.

请点亮这里.我也尝试在3节点火花簇上执行它,下面是截图: