标签: cluster-computing

跨群集共享Java同步块,还是使用全局锁?

我有一些代码,我只想允许一个线程访问.我知道如何使用synchronized块或方法来实现这一点,但这将在集群环境中工作吗?

目标环境是WebSphere 6.0,在集群中有2个节点.

我有一种感觉synchronized不行,因为每个节点上的每个应用程序实例都有自己的JVM,对吧?

我在这里尝试做的是在系统启动时对数据库记录执行一些更新.它将查找比代码版本更旧的任何数据库记录,并执行特定任务以更新它们.我只希望一个节点执行这些升级,因为我想确保每个工作项只升级一次,并且这些升级的性能不是一个大问题,因为它只发生在应用程序启动时,它只是真正做任何事情自上次启动以来代码更改的时间.

数据库是DB2v9,我通过JNDI直接访问它(没有ORM层).

有人建议全球锁定可能是这里的方式,但我不知道如何做到这一点.

有没有人在这个舞台上有任何指针?

谢谢!

java sql db2 locking cluster-computing

16
推荐指数
2
解决办法
2万
查看次数

Node.JS内置集群还是PM2集群?

哪个更好?

我已经与工作人员激活了Nodejs群集模式,但现在我发现PM2做了同样的事情.我正在使用keymetrics来查看我的网络服务器的统计数据,我注意到当我启动我的NodeJS节点(带有内置集群)而不使用PM2集群功能时,Keymetrics报告使用了20/30MB的Ram.

如果我停用群集(内部节点)并且我打开PM2群集,keymetrics会报告大约300MB的Ram使用情况.

现在,哪种方法更好,为什么内置集群keymetrics报告只有30MB的ram使用?

webserver cluster-computing node.js pm2

16
推荐指数
2
解决办法
2409
查看次数

Windows服务器上的Hadoop

我正在考虑使用hadoop处理现有Windows 2003服务器上的大型文本文件(大约10个四核处理器,内存为16GB)

问题是:

  1. 有没有关于如何在Windows上配置hadoop集群的好教程?

  2. 有什么要求?java + cygwin + sshd?还要别的吗?

  3. HDFS,它在Windows上播放得很好吗?

  4. 我想在流模式下使用hadoop.在c#中开发我自己的mapper/reducer的任何建议,工具或技巧?

  5. 您用什么来提交和监控工作?

谢谢

c# windows hadoop mapreduce cluster-computing

15
推荐指数
2
解决办法
9100
查看次数

doRedis如何运作?

我一直在玩redis数据库R接口,以及foreachdoRedis并行后端.我有几个问题,帮助我更好地应用此工具:

  1. doMC,doSMP,doSnow等似乎都可以通过在同一台计算机上调用工作进程,从列表和要应用的函数传递它们,然后收集结果来工作.在doMC的情况下,工作人员共享内存.但是,对于数据库如何提供相同的功能,我有点困惑.
  2. 当我将另一台从属计算机添加到doRedis作业队列时(如本视频所示),整个doredis数据库是否被发送到从属计算机?或者每个奴隶只是在特定时刻所需的数据(即列表的一个元素和要应用的函数).
  3. 如何将其他数据和函数显式传递给doRedis作业队列,每个从站都需要执行它的计算?
  4. 使用doRedis和foreach时,是否还有其他"陷阱"可能不适用于其他并行后端?

我知道这是很多问题,但我一直遇到这样一种情况,即我对并行处理如何工作的有限理解阻碍了我实现它的能力.例如,我最近尝试在大型数据库上并行化计算,并发现自己将整个数据库传递到我的集群上的每个节点,这一操作完全破坏了我从并行化中获得的任何优势.

谢谢!

parallel-processing r cluster-computing redis r-doredis

15
推荐指数
1
解决办法
1569
查看次数

JGroups,Terracotta和Hazelcast

试图围绕这3个项目,他们似乎都处理尝试集群时出现的稍微不同的问题.但是他们的所有文档都是为那些已经"知情"的开发人员编写的,并且像我这样的新手很难理解.

  • 他们每个人都试图解决的具体问题是什么,这些问题如何相互不同?
  • 每个群集与群集应用服务器(如JBoss或GlassFish的内置群集功能)有何不同?
  • 这些框架解决的问题是否足够不同以保证它们在同一个项目中的使用?或者他们是彼此的竞争对手,因此对相同/类似的问题有不同的解决方案?

提前感谢您对这些好奇但难以捉摸的框架的任何见解!

java terracotta jgroups cluster-computing hazelcast

15
推荐指数
1
解决办法
5601
查看次数

有没有办法将节点添加到正在运行的Hadoop集群?

我一直在玩Cloudera,我在开始工作之前定义了簇的数量,然后使用cloudera管理器确保一切都在运行.

我正在开发一个新项目,而不是使用hadoop使用消息队列来分配工作,但工作结果存储在HBase中.我可能会启动10个服务器来处理作业并存储到Hbase但是我想知道我以后是否决定添加更多的工作节点我可以轻松(读取:可编程)使它们自动连接到正在运行的集群,以便它们可以在本地添加集群HBase/HDFS?

这有可能吗?为了做到这一点,我需要学习什么?

hadoop hbase cluster-computing hdfs cloudera

15
推荐指数
1
解决办法
2万
查看次数

针对具有大量聚合的大型群集的ElasticSearch设置

上下文和当前状态

我们正在将我们的集群从Cassandra迁移到完整的ElasticSearch集群.我们正在为每秒平均约250-300个文档索引文档.在ElasticSearch 1.2.0中,它代表每天~8Go.

{
 "generic":
    {
      "id": "twi471943355505459200",
      "type": "twitter",
      "title": "RT @YukBerhijabb: The Life is Choice - https://m.facebook.com/story.php?story_fbid=637864496306297&id=100002482564531&refid=17",
      "content": "RT @YukBerhijabb: The Life is Choice - https://m.facebook.com/story.php?story_fbid=637864496306297&id=100002482564531&refid=17",
      "source": "<a href=\"https://twitter.com/download/android\" rel=\"nofollow\">Twitter for  Android</a>",
      "geo": null,
      "link": "http://twitter.com/rosi_sifah/status/471943355505459200",
      "lang": "en",
      "created_at": 1401355038000,
      "author": {
        "username": "rosi_sifah",
        "name": "Rosifah",
        "id": 537798506,
        "avatar": "http://pbs.twimg.com/profile_images/458917673456238592/Im22zoIV_normal.jpeg",
        "link": "http://twitter.com/rosi_sifah"
      }
    },
 "twitter": {
   // a tweet JSON
 }
}
Run Code Online (Sandbox Code Playgroud)

我们的用户在我们的SQL数据库中保存请求,当他们要求他们的仪表板时,我们想要请求我们的ES集群查询(从数据库中检索)并使用新的ES聚合框架在其上进行一些聚合.

每个仪表板都显示一个明确的,用户选择的日期范围,因此我们始终使用

"range": {
 "generic.created_at": {
   "from": 1401000000000,
   "to": 1401029019706 …
Run Code Online (Sandbox Code Playgroud)

scalability aggregate cluster-computing elasticsearch

15
推荐指数
1
解决办法
6275
查看次数

Spark - 如何在本地运行独立群集

是否有可能在一台机器上本地运行Spark独立集群(这与仅在本地开发作业(即local[*]))基本不同?

到目前为止,我正在运行2个不同的虚拟机来构建集群,如果我可以在同一台机器上运行独立集群,例如运行三个不同的JVM,该怎么办?

像多个环回地址这样的东西可以做到吗?

cluster-computing apache-spark

15
推荐指数
3
解决办法
2万
查看次数

WebSpere网络部署中的所谓节点

在使用Network Deployment的WebSphere Application Server安装中,节点是:

  1. 一台物理机器
  2. 操作系统的一个实例
  3. 一组逻辑WAS实例,独立于物理机或OS实例

deployment websphere cluster-computing

14
推荐指数
2
解决办法
1万
查看次数

网络故障后,RabbitMQ群集未重新连接

我有RabbitMQ集群,生产中有两个节点,集群正在打破这些错误消息:

= ERROR REPORT ==== 23-Dec-2011 ::
04:21:34 ===**节点兔子@ rabbitmq02没有响应**
**删除(超时)连接**

= INFO REPORT ==== 23-Dec-2011 ::
04:21:35 === 节点兔子@ rabbitmq02丢失'兔子'

= ERROR REPORT ==== 2011年12月23日::
04:21:49 === Mnesia(兔子@ rabbitmq01):**错误**mnesia_event得到{inconsistent_database,running_partitioned_network,rabbit @ rabbitmq02}

我试图通过使用"tcpkill"终止两个节点之间的连接来模拟问题,集群已断开连接,并且令人惊讶的是两个节点没有尝试重新连接!

当群集中断时,haproxy负载均衡器仍然将两个节点标记为活动并向两个节点发送请求,尽管它们不在群集中.

我的问题:

  1. 如果节点配置为群集,当我遇到网络故障时,他们为什么不尝试重新连接?

  2. 如何识别损坏的集群并关闭其中一个节点?分别使用两个节点时遇到一致性问题.

cluster-computing rabbitmq

14
推荐指数
3
解决办法
2万
查看次数