相关疑难解决方法(0)

我有一个示例应用程序正在从csv文件读取数据帧.可以使用该方法将数据帧以镶木地板格式存储到Hive表中 df.saveAsTable(tablename,mode).

上面的代码工作正常,但我每天都有如此多的数据,我想根据creationdate(表中的列)动态分区hive表.

有没有办法动态分区数据帧并将其存储到配置单元仓库.想要避免使用硬编码插入语句hivesqlcontext.sql(insert into table partittioin by(date)....).

任何帮助深表感谢.

30
推荐指数

4
解决办法

7万
查看次数

我想使用Spark数据帧的架构创建一个hive表.我怎样才能做到这一点？

对于固定列,我可以使用:

val CreateTable_query = "Create Table my table(a string, b string, c double)"
sparksession.sql(CreateTable_query)

但是我的数据框中有很多列,所以有没有办法自动生成这样的查询？

9
推荐指数

4
解决办法

5万
查看次数