我目前正在使用Apache Zeppelin 0.8.我试着像这样加载一个csv文件:
val df = spark.read.option("header", "true").option("inferSchema", "true").csv("/path/to/csv/name.csv")
Run Code Online (Sandbox Code Playgroud)
我也试过这个:
val df = spark.read.format("csv").option("header", "true").option("inferSchema", "true").load("/path/to/csv/name.csv")
Run Code Online (Sandbox Code Playgroud)
但是,它无法打印出以下内容:
org.apache.spark.SparkException:作业因阶段失败而中止:阶段2.0中的任务0失败1次,最近失败:阶段2.0中丢失的任务0.0(TID 2,localhost,执行器驱动程序):java.lang.NoSuchMethodError: org.apache.hadoop.fs.FileSystem $ Statistics.getThreadStatistics()Lorg /阿帕奇/的Hadoop/FS /文件系统$ $统计统计局数据;
注意: 问题解决 如果我使用zeppelin-env.sh中的SPARK_HOME env变量为Spark指定我自己的构建.但是,我仍然想要一个解决方案,这不需要我这样做,因为我有一些其他库不能与该版本的Spark一起使用.