标签: cluster-computing

本地集群上加载 Dask 数据：“工作线程超出了 95% 的内存预算”。重新启动然后“KilledWorker”

我知道以前也有人问过类似的问题，但他们的解决方案并不是很有帮助。我想最好的解决方案可能更具体于每个集群配置，因此我在此处提供有关我的集群和错误的更多详细信息。

import dask.dataframe as dd
import dask.bag as db
import json

from dask.distributed import Client, LocalCluster
cluster = LocalCluster()
client = Client(cluster)

Run Code Online (Sandbox Code Playgroud)

这是我的集群设置

cluster.scheduler

Run Code Online (Sandbox Code Playgroud)

＃输出：

Scheduler: tcp://127.0.0.1:35367 workers: 8 cores: 48 tasks: 0



cluster.workers

Run Code Online (Sandbox Code Playgroud)

＃输出：

{0: <Nanny: tcp://127.0.0.1:43789, threads: 6>,
 1: <Nanny: tcp://127.0.0.1:41375, threads: 6>,
 2: <Nanny: tcp://127.0.0.1:42577, threads: 6>,
 3: <Nanny: tcp://127.0.0.1:40171, threads: 6>,
 4: <Nanny: tcp://127.0.0.1:32867, threads: 6>,
 5: <Nanny: tcp://127.0.0.1:46529, threads: 6>,
 6: <Nanny: tcp://127.0.0.1:41535, threads: 6>,
 7: <Nanny: tcp://127.0.0.1:39645, threads: 6>}


client

Run Code Online (Sandbox Code Playgroud)

＃输出

Client
Scheduler: tcp://127.0.0.1:35367 …

Run Code Online (Sandbox Code Playgroud)

memory-management cluster-computing worker bigdata dask-dataframe

LCh*_*eng

lucky-day

3
推荐指数

1
解决办法

1180
查看次数

可扩展的网站

facebook,skype,myspace等...都拥有数百万用户,有谁知道他们的架构是什么样的.它是分布在不同的节点上还是使用大量集群？

scalability cluster-computing

作者

2012 07-02

2
推荐指数

1
解决办法

221
查看次数

计算机集群可以用于一般日常应用吗？

有谁知道计算机集群如何用于日常应用,例如视频游戏？

我想构建一个可以在群集上运行应用程序的计算机群集,这些应用程序不是专门为计算机群集设计的,但仍然可以看到性能提升.一个用途是用于视频游戏,但我也想利用增加的计算能力来运行大型虚拟机网络.

distributed-computing cluster-computing

Mat*_*coe

2013 03-11

2
推荐指数

1
解决办法

3416
查看次数

LBA和集群

我想知道LBA和簇号.

我的问题是:

LBA 0总是第2组？
那么集群0和1是什么？
只有集群和LBA之间的区别就在于它们从磁盘开始的位置？
CHS,LBA,集群nubmer之间的关系？

在流动的代码中, add ax, WORD [datasector]代码是什么？

;************************************************;
; Convert CHS to LBA
; LBA = (cluster - 2) * sectors per cluster
;************************************************;


ClusterLBA:
          sub     ax, 0x0002                          ; zero base cluster number
          xor     cx, cx
          mov     cl, BYTE [bpbSectorsPerCluster]     ; convert byte to word
          mul     cx
          add     ax, WORD [datasector]               ; base data sector
          ret

Run Code Online (Sandbox Code Playgroud)

filesystems operating-system disk cluster-computing relationship

kim*_*yun

2011 04-25

2
推荐指数

1
解决办法

2929
查看次数

Hazelcast流程

我的主管让我使用Hazelcast作为我们的一个java程序,需要24小时才能处理大量的txt文件(2 GB或更多).我查看了Hazelcast网站上的文档,但我的头脑旋转得很厉害,我无法理解那里描述的内容.我不是一个非常称职的java程序员.我是一名网络开发人员.如果我需要在Hazelcast中运行我的java程序,有哪些步骤？

我将非常感谢你的帮助.

java cluster-computing hazelcast

Wor*_*rld

2012 07-02

2
推荐指数

1
解决办法

843
查看次数

Node.js - 核心集群模块

我在节点v0.6.5中使用核心群集模块.我有以下代码:

var cluster = require('cluster');
var http = require('http');
var numWorkers = 3;

var count = 0;

if (cluster.isMaster) {
  for (var i = 0; i < numWorkers; i++) {
    cluster.fork();
  }
} else {
  console.log('createServer called');
  http.createServer(function (req, res) {
    count++;
    res.writeHead(200, {'Content-Type': 'text/plain'});
    res.end('Count is: ' + count.toString());
  }).listen(1337, "127.0.0.1");
}

Run Code Online (Sandbox Code Playgroud)

每当我点击页面时,计数会递增两次,例如1,3,5,7 ...为什么会增加两次？

cluster-computing node.js

jef*_*eon

lucky-day

2
推荐指数

1
解决办法

621
查看次数

群集上的Parfor:无法识别功能

我尝试在群集的不同机器上运行一个简单的任务.我的配置已经过验证(没关系).当我在"本地"配置上运行代码时,它可以工作.但是当我使用群集配置时,我收到以下错误:

使用parallel_function时出错(第598行)未定义函数'lafunc'用于'double'类型的输入参数.错误堆栈:(没有远程错误堆栈)petittest中的错误(第6行) - »(petittest是我程序的名称)parfor it = 1:200

我尝试修改代码使用"dfeval"而不是parfor循环,但我得到了相同类型的结果(无法识别函数lafunc).

如何让群集中的其他工作人员识别我手动定义的函数lafunc？

代码如下:

%%%%%%%%%%%%%
laconfig='/home/matlab/fred/LACED_DC1.mat';
setmcruserdata('ParallelConfigurationFile',laconfig);

matlabpool open

parfor it=1:200

yo=lafunc(it);
disp(yo)

end

matlabpool close

%%%%%%%%%%%

Run Code Online (Sandbox Code Playgroud)

lafunc函数的位置

%%%%%%%%%%%%%%

function [y]=lafunc(x)
y=x*x;
end

%%%%%%%%%%%%%%%%%%%%%%

Run Code Online (Sandbox Code Playgroud)

非常感谢,每一条信息都对我有用!

parallel-processing matlab cluster-computing

Fré*_*din

lucky-day

2
推荐指数

1
解决办法

3819
查看次数

什么是套接字,核心,线程,CPU？

我目前正在志愿学习Linux服务器,我也对学习集群计算技术感兴趣.

在本实验中,他们有一个小型集群,其中包含一个头节点和两个计算节点.

当我在头节点上尝试lscpu命令时,计算node1,node2.单击链接以查看详细信息.

CPU - 头部24,computenode1和computenode2.它是指主板上的24个物理CPU吗？

套接字 - 头部2,computenode1和computenode2.有人能解释一下吗？

每个插槽的内核 - 头部为6,computenode1和computenode2.有人能解释一下吗？

每个核心的线程 - 头部为2,computenode1和computenode2.有人能解释一下吗？

cpu core cluster-computing

bio*_*rch

lucky-day

2
推荐指数

1
解决办法

2万
查看次数

我可以通过互联网使用kafka吗？

kafka是否适合互联网使用？

更准确地说，我想要将kafka主题公开为“公共接口”，然后外部使用者（或生产者）可以连接到它。可能吗？

如果我想同时在内部和外部网络中使用群集，我会听到一些问题，因为这样很难配置advertised.host.name。真的吗？

我还必须暴露动物园管理员吗？我认为新的消费者/生产者api不再需要它。

authentication cluster-computing nat wan apache-kafka

nty*_*sdd

2019 07-22

2
推荐指数

3
解决办法

3844
查看次数

如何在Rust中处理分布式内存并行性？

如何在Rust中处理分布式内存并行性？通过这种方式,我的意思是语言结构,库或其他功能来处理类似于MPI提供C的集群之类的计算,但不一定使用相同的原语或方法.在Rustonomicon中,我看到了对线程和并发性的讨论,但我没有看到有关跨多台计算机并行化的讨论.

parallel-processing hpc cluster-computing mpi rust

wye*_*r33

2018 10-06

2
推荐指数

1
解决办法

244
查看次数

标签统计

cluster-computing ×10

parallel-processing ×2

apache-kafka ×1

authentication ×1

bigdata ×1

core ×1

cpu ×1

dask-dataframe ×1

disk ×1

distributed-computing ×1

filesystems ×1

hazelcast ×1

hpc ×1

java ×1

matlab ×1

memory-management ×1

mpi ×1

nat ×1

node.js ×1

operating-system ×1

relationship ×1

rust ×1

scalability ×1

wan ×1

worker ×1

标签 统计

标签统计