标签: distributed

def invokeTimer(i):
   if timer(i) expired:
      copyDataFromNode(i)
      killNode(i)

while True:
   for i in range(1,10):
      startNode(i)
      # Allow the node to boot up
      startScript(i)
      invokeTimer(i)
   sleep(60000)

Run Code Online (Sandbox Code Playgroud)

假设我能够传达我的想法,是否有一种很好的方式以干净的方式实现这一点,或者可能是一个可能有帮助的教程？

python distributed amazon-ec2

Leg*_*end

2011 07-16

4
推荐指数

2
解决办法

302
查看次数

分布式系统中的数据同步

我们在Restlet框架上构建了一个基于REST的应用程序,它支持CRUD操作.它使用本地文件来存储数据.

现在要求是在多个VM上部署此应用程序,并且一个VM中的任何更新操作都需要传播在其他VM上运行的其他应用程序实例.

我们解决这个问题的想法是在给定VM中发生更新操作时发送多个POST消息(对所有其他应用程序).这里假设每个应用程序都有一个所有其他应用程序的列表/ URL.

有没有更好的方法来解决这个问题？

rest distributed synchronization

san*_*fin

2016 06-08

4
推荐指数

2
解决办法

3060
查看次数

我正在研究RabbitMQ分布式POC,我坚持集群节点的基础知识.
我正在尝试按照兔子的群集教程进行操作,这是我的参考.
在安装了erlang(R14B04)和rabbit(2.8.2-1)后,我将.erlang.cookie文件内容从一个节点复制到另外两个节点.
我不知道如何让erlang注意到这个改变我必须重新启动机器本身(相当蛮力,但我根本不知道erlang).
另外,我在iptables 4369和另外5个端口进行通信,并放置在/usr/lib64/erlang/bin/sys.config以下配置下:

{kernel,[{inet_dist_listen_min, XX00},{inet_dist_listen_max,XX05}]}]

Run Code Online (Sandbox Code Playgroud)

然后另一次重启(我知道愚蠢)以验证erlang考虑到这些,但仍然在我运行时:

rabbitmqctl cluster rabbit@HostName1

Run Code Online (Sandbox Code Playgroud)

我明白了:

Clustering node rabbit@HostName2 with [rabbit@HostName1] ...
Error: {no_running_cluster_nodes,[rabbit@HostName1],
                                 [rabbit@HostName1]}

Run Code Online (Sandbox Code Playgroud)

我有可能摆弄erlang.cookie或端口没有成功,但我不知道如何检查它们.我尝试输入erlcmd然后erl_epmd:names()或其他命令来获取更多信息,但我可能在erlang土地上离开了.

真的很感激任何帮助

更新:
我尝试手动ping两个erlang节点并pang返回.
我做了以下操作:
连接到两个节点,停止rabbitmq(不确定是否需要,但确定),启动erlang就像这样(erl -sname dilbert和erl -sname dilbert2)当erlang命令行启动时我node().在每个节点上运行dilbert@HostName1并dilbert2@HostName2分别获得.然后我尝试使用单引号运行net_adm:ping('dilbert').并且net_adm:ping('dilbert@HostName1').没有它们来自两个节点(当然更改了名称)并且完成了所有8个案例pang.
当我nodes().在其中一台机器上运行时,我得到了一个空数组.
我还尝试允许防火墙中的所有流量(脚本),然后尝试运行上面的命令(不要担心它们现在又回来了)并且仍然回来了pang.
Update2:
由于某些原因,我需要解决cookie不匹配问题(感谢@ kjw0188的建议[我erlang:get_cookie().在erlang命令行中运行]).
这没有帮助,我需要完全停止iptables(不知道为什么,但我很快就会-name dilbert@my-ip想到)并加载erlang节点,因为我的rackspace服务器没有dns-name.这最终使我得到了一个乒乓球并看到节点相互看到(nodes().在ping之后返回一个非空数组).
我现在面临的问题是如何在启动erlang时指示RabbitMQ使用-name而不是-sname.

erlang distributed connectivity rabbitmq

Itt*_*tai

2012 06-18

4
推荐指数

1
解决办法

1万
查看次数

重用mongo内部分布式锁

我需要为我的应用程序提供分布式锁实现.我有许多独立的工作流程,我需要强制执行限制,他们一次只能在一个帐户上工作.

该应用程序使用mongo db层在c#中编写.我注意到mongo的集群平衡器使用分布式锁定机制来控制哪些mongos正在进行平衡,我想知道我是否可以在我的应用程序中重用相同的机制？

我宁愿没有实现我自己的分布式锁机制的开销,因为所有的工作进程都使用mongo进行接口处理,所以如果我可以重用它们的实现那将是很好的.

distributed locking mongodb

bet*_*rox

lucky-day

4
推荐指数

1
解决办法

1419
查看次数

从Hadoop提供静态文件

我的工作是为静态图像/视频文件设计分布式系统.数据大小约为数十TB.它主要用于HTTP访问(因此不对数据进行处理;或者只进行简单的处理,例如调整大小 - 但这并不重要,因为它可以直接在应用程序中完成).

为了更清楚一点,它是一个系统:

必须分布(水平刻度),因为数据的总大小非常大.
主要通过HTTP提供小型静态文件(如图像,缩略图,短视频).
通常,不需要处理数据(因此不需要MapReduce)
可以轻松地对数据设置HTTP访问.
(应该)良好的吞吐量.

我正在考虑:

本机网络文件系统:但似乎不可行,因为数据无法放入一台机器.
Hadoop文件系统.之前我使用过Hadoop mapreduce,但我没有使用Hadoop作为HTTP请求的静态文件存储库的经验.所以我不知道它是否可能或是否是推荐的方式.
MogileFS.这似乎很有希望,但我觉得使用MySQL来管理本地文件(在一台机器上)会产生太多的开销.

有什么建议吗？

distributed hadoop scalability mapreduce weed-fs

hir*_*iro

2014 11-13

4
推荐指数

1
解决办法

1335
查看次数

使用图表间复制未初始化Tensorflow变量

我有test.py如下Python代码,它使用分布式Tensorflow的"Between-graph Replication":

import argparse
import logging

import tensorflow as tf

log = logging.getLogger(__name__)

# Job Names
PARAMETER_SERVER = "ps"
WORKER_SERVER = "worker"

# Cluster Details
CLUSTER_SPEC = {
    PARAMETER_SERVER: ["localhost:2222"],
    WORKER_SERVER: ["localhost:1111", "localhost:1112"]}


def parse_command_arguments():
    """ Set up and parse the command line arguments passed for experiment. """
    parser = argparse.ArgumentParser(
        description="Parameters and Arguments for the Test.")
    parser.add_argument(
        "--job_name",
        type=str,
        default="",
        help="One of 'ps', 'worker'"
    )
    # Flags for defining the tf.train.Server
    parser.add_argument(
        "--task_index",
        type=int,
        default=0,
        help="Index of …

Run Code Online (Sandbox Code Playgroud)

python distributed python-3.x tensorflow

Ruo*_*ong

2017 03-29

4
推荐指数

1
解决办法

2537
查看次数