我有n(large)一些小尺寸的 orc 文件,我想将它们合并到k(small)一些大的 orc 文件中。
n(large)
k(small)
这是使用alter table table_name concatenateHive 中的命令完成的。
alter table table_name concatenate
我想了解 Hive 是如何实现这一点的。我希望使用 Spark 来实现此功能,并根据需要进行任何更改。
任何指点都会很棒。
hadoop hive hiveql orc
hadoop ×1
hive ×1
hiveql ×1
orc ×1