我有以下问题.
为什么在标准节点上提交作业(最大核56)时一切运行正常,但是当我向big_memory节点(最大核128)提交相同的作业/代码时,我收到错误?
- R中的并行化代码:
no_cores < - detectCores() - 1
cl < - makeCluster(no_cores,outfile = paste0('./ info_parallel.log'))
- 错误......
socketConnection出错(master,port = port,blocking = TRUE,open ="a + b",:
无法打开连接
调用:... doTryCatch - > recvData - > makeSOCKmaster - > socketConnection
另外:警告信息:
在socketConnection中(master,port = port,blocking = TRUE,open ="a + b",:
localhost:11232无法打开
执行停止
反序列化错误(节点$ con):从连接读取错误
调用:... doTryCatch - > recvData - > recvData.SOCKnode - > unserialize
执行停止
反序列化错误(节点$ con):从连接读取错误
调用:... doTryCatch - > recvData - > recvData.SOCKnode - > unserialize
执行停止
正如我所说,R代码在标准节点上运行良好,所以我认为它是large_memory节点的问题.那可能是什么?
谢谢,