Spark节点继续打印GC（分配失败），并且没有任务运行

Question

Spark节点继续打印GC（分配失败），并且没有任务运行

Eri*_*ows 5 hadoop scala apache-spark livy

我正在使用Scala运行Spark作业，但由于工作节点无法执行和执行任务而陷入困境。

目前，我将此提交给Livy，后者将使用以下配置将其提交给我们的Spark集群，该集群具有8个内核和12GB RAM：

data={
    'file': bar_jar.format(bucket_name),
    'className': 'com.bar.me',
    'jars': [
        common_jar.format(bucket_name),
    ],
    'args': [
        bucket_name,
        spark_master,
        data_folder
    ],
    'name': 'Foo',
    'driverMemory': '2g',
    'executorMemory': '9g',
    'driverCores': 1,
    'executorCores': 1,
    'conf': {
        'spark.driver.memoryOverhead': '200',
        'spark.executor.memoryOverhead': '200',
        'spark.submit.deployMode': 'cluster'
    }
}

Run Code Online (Sandbox Code Playgroud)

然后，节点日志将被不断填充：

2019-03-29T22:24:32.119+0000: [GC (Allocation Failure) 2019-03-29T22:24:32.119+0000:
[ParNew: 68873K->20K(77440K), 0.0012329 secs] 257311K->188458K(349944K), 
0.0012892 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

Run Code Online (Sandbox Code Playgroud)

问题在于下一个阶段和任务没有执行，因此行为是出乎意料的。