标签: cluster-computing

本地集群上加载 Dask 数据:“工作线程超出了 95% 的内存预算”。重新启动然后“KilledWorker”

我知道以前也有人问过类似的问题,但他们的解决方案并不是很有帮助。我想最好的解决方案可能更具体于每个集群配置,因此我在此处提供有关我的集群和错误的更多详细信息。

import dask.dataframe as dd
import dask.bag as db
import json

from dask.distributed import Client, LocalCluster
cluster = LocalCluster()
client = Client(cluster)
Run Code Online (Sandbox Code Playgroud)

这是我的集群设置

cluster.scheduler
Run Code Online (Sandbox Code Playgroud)

#输出:

Scheduler: tcp://127.0.0.1:35367 workers: 8 cores: 48 tasks: 0



cluster.workers
Run Code Online (Sandbox Code Playgroud)

#输出:

{0: <Nanny: tcp://127.0.0.1:43789, threads: 6>,
 1: <Nanny: tcp://127.0.0.1:41375, threads: 6>,
 2: <Nanny: tcp://127.0.0.1:42577, threads: 6>,
 3: <Nanny: tcp://127.0.0.1:40171, threads: 6>,
 4: <Nanny: tcp://127.0.0.1:32867, threads: 6>,
 5: <Nanny: tcp://127.0.0.1:46529, threads: 6>,
 6: <Nanny: tcp://127.0.0.1:41535, threads: 6>,
 7: <Nanny: tcp://127.0.0.1:39645, threads: 6>}


client
Run Code Online (Sandbox Code Playgroud)

#输出

Client
Scheduler: tcp://127.0.0.1:35367 …
Run Code Online (Sandbox Code Playgroud)

memory-management cluster-computing worker bigdata dask-dataframe

3
推荐指数
1
解决办法
1180
查看次数

可扩展的网站

facebook,skype,myspace等...都拥有数百万用户,有谁知道他们的架构是什么样的.它是分布在不同的节点上还是使用大量集群?

scalability cluster-computing

2
推荐指数
1
解决办法
221
查看次数

计算机集群可以用于一般日常应用吗?

有谁知道计算机集群如何用于日常应用,例如视频游戏?

我想构建一个可以在群集上运行应用程序的计算机群集,这些应用程序不是专门为计算机群集设计的,但仍然可以看到性能提升.一个用途是用于视频游戏,但我也想利用增加的计算能力来运行大型虚拟机网络.

distributed-computing cluster-computing

2
推荐指数
1
解决办法
3416
查看次数

LBA和集群

我想知道LBA和簇号.

我的问题是:

  1. LBA 0总是第2组?

  2. 那么集群0和1是什么?

  3. 只有集群和L​​BA之间的区别就在于它们从磁盘开始的位置?

  4. CHS,LBA,集群nubmer之间的关系?

  5. 在流动的代码中, add ax, WORD [datasector]代码是什么?

    ;************************************************;
    ; Convert CHS to LBA
    ; LBA = (cluster - 2) * sectors per cluster
    ;************************************************;
    
    
    ClusterLBA:
              sub     ax, 0x0002                          ; zero base cluster number
              xor     cx, cx
              mov     cl, BYTE [bpbSectorsPerCluster]     ; convert byte to word
              mul     cx
              add     ax, WORD [datasector]               ; base data sector
              ret
    
    Run Code Online (Sandbox Code Playgroud)

filesystems operating-system disk cluster-computing relationship

2
推荐指数
1
解决办法
2929
查看次数

Hazelcast流程

我的主管让我使用Hazelcast作为我们的一个java程序,需要24小时才能处理大量的txt文件(2 GB或更多).我查看了Hazelcast网站上的文档,但我的头脑旋转得很厉害,我无法理解那里描述的内容.我不是一个非常称职的java程序员.我是一名网络开发人员.如果我需要在Hazelcast中运行我的java程序,有哪些步骤?

我将非常感谢你的帮助.

java cluster-computing hazelcast

2
推荐指数
1
解决办法
843
查看次数

Node.js - 核心集群模块

我在节点v0.6.5中使用核心群集模块.我有以下代码:

var cluster = require('cluster');
var http = require('http');
var numWorkers = 3;

var count = 0;

if (cluster.isMaster) {
  for (var i = 0; i < numWorkers; i++) {
    cluster.fork();
  }
} else {
  console.log('createServer called');
  http.createServer(function (req, res) {
    count++;
    res.writeHead(200, {'Content-Type': 'text/plain'});
    res.end('Count is: ' + count.toString());
  }).listen(1337, "127.0.0.1");
}
Run Code Online (Sandbox Code Playgroud)

每当我点击页面时,计数会递增两次,例如1,3,5,7 ...为什么会增加两次?

cluster-computing node.js

2
推荐指数
1
解决办法
621
查看次数

群集上的Parfor:无法识别功能

我尝试在群集的不同机器上运行一个简单的任务.我的配置已经过验证(没关系).当我在"本地"配置上运行代码时,它可以工作.但是当我使用群集配置时,我收到以下错误:

使用parallel_function时出错(第598行)未定义函数'lafunc'用于'double'类型的输入参数.错误堆栈:(没有远程错误堆栈)petittest中的错误(第6行) - »(petittest是我程序的名称)parfor it = 1:200

我尝试修改代码使用"dfeval"而不是parfor循环,但我得到了相同类型的结果(无法识别函数lafunc).

如何让群集中的其他工作人员识别我手动定义的函数lafunc?

代码如下:

%%%%%%%%%%%%%
laconfig='/home/matlab/fred/LACED_DC1.mat';
setmcruserdata('ParallelConfigurationFile',laconfig);

matlabpool open

parfor it=1:200

yo=lafunc(it);
disp(yo)

end

matlabpool close

%%%%%%%%%%%
Run Code Online (Sandbox Code Playgroud)

lafunc函数的位置

%%%%%%%%%%%%%%

function [y]=lafunc(x)
y=x*x;
end

%%%%%%%%%%%%%%%%%%%%%%
Run Code Online (Sandbox Code Playgroud)

非常感谢,每一条信息都对我有用!

parallel-processing matlab cluster-computing

2
推荐指数
1
解决办法
3819
查看次数

什么是套接字,核心,线程,CPU?

我目前正在志愿学习Linux服务器,我也对学习集群计算技术感兴趣.

在本实验中,他们有一个小型集群,其中包含一个头节点和两个计算节点.

当我在头节点上尝试lscpu命令时,计算node1,node2.单击链接以查看详细信息.

CPU - 头部24,computenode1和computenode2.它是指主板上的24个物理CPU吗?

套接字 - 头部2,computenode1和computenode2.有人能解释一下吗?

每个插槽的内核 - 头部为6,computenode1和computenode2.有人能解释一下吗?

每个核心的线程 - 头部为2,computenode1和computenode2.有人能解释一下吗?

cpu core cluster-computing

2
推荐指数
1
解决办法
2万
查看次数

我可以通过互联网使用kafka吗?

kafka是否适合互联网使用?

更准确地说,我想要将kafka主题公开为“公共接口”,然后外部使用者(或生产者)可以连接到它。可能吗?

如果我想同时在内部和外部网络中使用群集,我会听到一些问题,因为这样很难配置advertised.host.name。真的吗?

我还必须暴露动物园管理员吗?我认为新的消费者/生产者api不再需要它。

authentication cluster-computing nat wan apache-kafka

2
推荐指数
3
解决办法
3844
查看次数

如何在Rust中处理分布式内存并行性?

如何在Rust中处理分布式内存并行性?通过这种方式,我的意思是语言结构,库或其他功能来处理类似于MPI提供C的集群之类的计算,但不一定使用相同的原语或方法.在Rustonomicon中,我看到了对线程和并发性的讨论,但我没有看到有关跨多台计算机并行化的讨论.

parallel-processing hpc cluster-computing mpi rust

2
推荐指数
1
解决办法
244
查看次数