在Hive中,"在路径中加载数据本地"是否会覆盖现有数据或附加?

CMa*_*ury 5 hadoop hbase hive hdfs

我希望在cron上运行Hive导入,并希望只是使用

"将数据本地inpath'/ tmp/data/x'加载到表X中"就足够了.

后续命令会覆盖表中已有的内容吗?还是会附加?

Qui*_*nnG 6

在与Hive打交道时,这个网站http://wiki.apache.org/hadoop/Hive/LanguageManual是你的朋友.:)

解决将数据加载到Hive的 页面是http://wiki.apache.org/hadoop/Hive/LanguageManual/DML该页面指出

如果使用OVERWRITE关键字,则将删除目标表(或分区)的内容,并替换为filepath引用的文件.否则,filepath引用的文件将添加到表中.请注意,如果目标表(或分区)已有一个名称与文件路径中包含的任何文件名冲突的文件,则现有文件将替换为新文件.

在您的情况下,您没有使用OVERWRITE关键字,因此文件将添加到表中.(除非它们是相同的文件,在这种情况下它们会被覆盖)