NoClassDefFoundError：在 Spark 独立集群上部署后无法初始化 XXX 类

Dr.*_*Pro 5 deployment scala apache-spark spark-streaming spark-submit

我写了一个用 sbt 构建的火花流应用程序。它在本地工作得很好，但是在部署到集群上之后，它抱怨我在胖 jar 中清楚地写了一个类（使用 jar tvf 检查）。以下是我的项目结构。XXX对象是spark抱怨的对象

src
`-- main
    `-- scala
        |-- packageName
        |   `-- XXX object
        `-- mainMethodEntryObject

Run Code Online (Sandbox Code Playgroud)

我的提交命令：

$SPARK_HOME/bin/spark-submit \
  --class mainMethodEntryObject \
  --master REST_URL\
  --deploy-mode cluster \
  hdfs:///FAT_JAR_PRODUCED_BY_SBT_ASSEMBLY

Run Code Online (Sandbox Code Playgroud)

具体错误信息：

java.lang.NoClassDefFoundError: Could not initialize class XXX

Run Code Online (Sandbox Code Playgroud)

没有代码很难说，但看起来像是 XXX 对象的序列化问题。我不能说我完全理解为什么，但重点是该对象没有运送到执行者。

对我有用的解决方案是将您的对象转换为扩展的类Serializable，并在您需要的地方实例化它。所以基本上，如果我没记错的话，你有

object test {
   def foo = ...
}

Run Code Online (Sandbox Code Playgroud)

这将在你的 main 中使用test.foo，但你至少需要

class Test extends Serializable {
   def foo = ...
}

Run Code Online (Sandbox Code Playgroud)

然后在你的主要部分val test = new Test开始，就是这样。

归档时间：	8 年，8 月前
查看次数：	3740 次
最近记录：	5 年前

功能语言(Erlang,F#,Haskell,Scala) 28

是否有用于在Scala中创建GUI的GUI？ 9

Scalas/Haskells解析器组合器是否足够？ 8

如何在现有的asp.net网站上创建或附加WCF服务 6

使用Intelli J在Scala中查找未使用的方法 6

我的servlet.war的URL是什么？ 5

如何找到多列的最大值？ 4

如何在 Spark Scala 中的窗口 PartitionBy 中应用多列 2

如何在Pyspark中的Dictionary中转换Dataframe Column1:Column2(key:value)？ 1

使用 Scala 将 Spark DataFrame 中某个 DataType 的所有列的 DataType 转换为另一种 DataType 1

如何使用JavaScript复制到剪贴板？ 3131

jQuery滚动到元素 2196

Java中的"实现Runnable"与"扩展线程" 2023

HTML中id属性的有效值是什么？ 1945

如何基于通配符匹配以递归方式查找当前和子文件夹中的所有文件？ 1695

Dockerfile中CMD和ENTRYPOINT有什么区别？ 1484

如何获取MySQL用户帐户列表 1320

如何从GET参数中获取值？ 1255

纯JavaScript相当于jQuery的$ .ready() - 如何在页面/ DOM准备就绪时调用函数 1244

UTF-8一路走来 1146