使用Yarn给出错误来运行spark作业:com.google.common.util.concurrent.Futures.withFallback

Question

使用Yarn给出错误来运行spark作业:com.google.common.util.concurrent.Futures.withFallback

Abh*_*ute 3 hadoop classpath hadoop-yarn apache-spark

我正在尝试使用纱线运行火花工作,但低于错误

java.lang.NoSuchMethodError: com.google.common.util.concurrent.Futures.withFallback(Lcom/google/common/util/concurrent/ListenableFuture;Lcom/google/common/util/concurrent/FutureFallback;Ljava/util/concurrent/Executor;)Lcom/google/common/util/concurrent/ListenableFuture;
at com.datastax.driver.core.Connection.initAsync(Connection.java:176)
at com.datastax.driver.core.Connection$Factory.open(Connection.java:721)
at com.datastax.driver.core.ControlConnection.tryConnect(ControlConnection.java:248)
at com.datastax.driver.core.ControlConnection.reconnectInternal(ControlConnection.java:194)
at com.datastax.driver.core.ControlConnection.connect(ControlConnection.java:82)
at com.datastax.driver.core.Cluster$Manager.init(Cluster.java:1307)
at com.datastax.driver.core.Cluster.init(Cluster.java:159)
at com.datastax.driver.core.Cluster.connect(Cluster.java:249)
at com.figmd.processor.ProblemDataloader$ParseJson.call(ProblemDataloader.java:46)
at com.figmd.processor.ProblemDataloader$ParseJson.call(ProblemDataloader.java:34)
at org.apache.spark.api.java.JavaRDDLike$$anonfun$fn$4$1.apply(JavaRDDLike.scala:140)
at org.apache.spark.api.java.JavaRDDLike$$anonfun$fn$4$1.apply(JavaRDDLike.scala:140)
at org.apache.spark.rdd.RDD$$anonfun$14.apply(RDD.scala:618)
at org.apache.spark.rdd.RDD$$anonfun$14.apply(RDD.scala:618)
at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:35)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:280)
at org.apache.spark.rdd.RDD.iterator(RDD.scala:247)
at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:61)
at org.apache.spark.scheduler.Task.run(Task.scala:56)
at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:200)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)

Run Code Online (Sandbox Code Playgroud)

cluster详细信息:Spark 1.2.1,hadoop 2.7.1我使用spark.driver.extraClassPath提供了类路径.hadoop用户也可以访问该类路径.但我认为yarn并没有获得该类路径上的JAR.我无法达到它的根本原因.任何帮助将不胜感激.

谢谢.

Answer 1

arj*_*nes 6

我面临同样的问题,解决方案是阴凉番石榴,以避免classpath碰撞.

如果你正在使用sbt程序集来构建你的jar,你可以将它添加到你的build.sbt:

assemblyShadeRules in assembly := Seq(
  ShadeRule.rename("com.google.**" -> "shadeio.@1").inAll
)

Run Code Online (Sandbox Code Playgroud)

我写了一篇博客文章,描述了我到达这个解决方案的过程:让Hadoop 2.6 + Spark-Cassandra驱动程序一起玩.

希望能帮助到你!

归档时间：	10 年，6 月前
查看次数：	1819 次
最近记录：	9 年，9 月前