pra*_*see 13 java scala hdfs apache-spark
我安装了Apache Spark 0.9.0群集,我正在尝试部署从HDFS读取文件的代码.这段代码抛出警告,最终失败了.这是代码
/**
* running the code would fail
* with a warning
* Initial job has not accepted any resources; check your cluster UI to ensure that
* workers are registered and have sufficient memory
*/
object Main extends App {
val sconf = new SparkConf()
.setMaster("spark://labscs1:7077")
.setAppName("spark scala")
val sctx = new SparkContext(sconf)
sctx.parallelize(1 to 100).count
}
Run Code Online (Sandbox Code Playgroud)
以下是警告消息
初始工作没有接受任何资源; 检查群集UI以确保工作人员已注册并具有足够的内存
如何摆脱这个或我错过了一些配置.
当你通过设置spark.cores.max和spark.executor.memoryresp' 请求的内核数量或RAM(每个节点)超过可用内容时,就可以得到这个结果.因此,即使没有其他人正在使用群集,并且您指定要使用,例如每个节点100GB RAM,但您的节点只能支持90GB,那么您将收到此错误消息.
公平地说,在这种情况下,信息是模糊的,如果它说超出最大值,那将更有帮助.
看起来 Spark master 无法为该任务分配任何工作人员。要么工人还没有开始工作,要么他们都在忙。
SPARK_MASTER_WEBUI_PORT检查主节点上的 Spark UI(端口由in指定spark-env.sh,默认为 8080)。它应该看起来像这样:
为了使集群正常运行:
| 归档时间: |
|
| 查看次数: |
8712 次 |
| 最近记录: |