相关疑难解决方法(0)

如何在单个加载中导入多个csv文件?

考虑我有一个已定义的架构,用于在文件夹中加载10个csv文件.有没有办法使用Spark SQL自动加载表.我知道这可以通过为每个文件[下面给出]使用单独的数据帧来执行,但是可以使用单个命令自动执行而不是指向文件我可以指向文件夹吗?

df = sqlContext.read
       .format("com.databricks.spark.csv")
       .option("header", "true")
       .load("../Downloads/2008.csv")
Run Code Online (Sandbox Code Playgroud)

apache-spark apache-spark-sql spark-dataframe

38
推荐指数
5
解决办法
6万
查看次数