小编Sam*_*mar的帖子

火花故障：由以下原因引起：org.apache.spark.shuffle.FetchFailedException：框架太大：5454002341

我正在为确定父级表的表生成层次结构。

即使在收到有关太大框架的错误之后，也使用以下配置：

火花特性

--conf spark.yarn.executor.memoryOverhead=1024mb \
--conf yarn.nodemanager.resource.memory-mb=12288mb \
--driver-memory 32g \
--driver-cores  8 \
--executor-cores 32 \
--num-executors 8 \
--executor-memory 256g \
--conf spark.maxRemoteBlockSizeFetchToMem=15g

Run Code Online (Sandbox Code Playgroud)

import org.apache.log4j.{Level, Logger};
import org.apache.spark.SparkContext;
import org.apache.spark.sql.{DataFrame, SparkSession};
import org.apache.spark.sql.functions._;
import org.apache.spark.sql.expressions._;


lazy val sparkSession = SparkSession.builder.enableHiveSupport().getOrCreate();

import spark.implicits._;

val hiveEmp: DataFrame = sparkSession.sql("select * from db.employee");
hiveEmp.repartition(300);
import org.apache.spark.sql.functions._;

val nestedLevel = 3;

val empHierarchy = (1 to nestedLevel).foldLeft(hiveEmp.as("wd0")) { (wDf, i) =>
val j = i - 1
wDf.join(hiveEmp.as(s"wd$i"), col(s"wd$j.parent_id".trim) === col(s"wd$i.id".trim), …

Run Code Online (Sandbox Code Playgroud)

hadoop-yarn apache-spark apache-spark-sql

Sam*_*mar

2019 10-08

3
推荐指数

3
解决办法

8745
查看次数