相关疑难解决方法(0)

生成镶木地板文件的元数据

我有一个蜂巢桌,建在一堆外部镶木地板文件的顶部.Paruqet文件应该由spark作业生成,但由于将元数据标志设置为false,因此不会生成它们.我想知道是否有可能以一种无痛的方式恢复它.文件结构如下:

/apps/hive/warehouse/test_db.db/test_table/_SUCCESS
/apps/hive/warehouse/test_db.db/test_table/_common_metadata
/apps/hive/warehouse/test_db.db/test_table/_metadata
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-20
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-21
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-22
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-23
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-24
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-25
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-26
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-27
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-28
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-29
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-30

Run Code Online (Sandbox Code Playgroud)

我们假设该文件_metadata是不存在的或过时的.有没有办法通过hive命令重新创建它/生成它而无需启动整个spark工作？

hadoop hive apache-spark parquet

Nie*_*and

2016 05-25

15
推荐指数

1
解决办法

4225
查看次数