如何删除hive hadoop数据库中的行

Sun*_*nny 4 hadoop hive delete-row

我是hadoop&hive的新手.我想删除我的数据库中的某些行 - 这是在hive-hadoop上.我知道它不支持开箱即用,而hadoop是一个只读文件系统.我很好奇有什么是实现这一目标的最佳方法.如果有人以前这样做过,他们可以分享他们的学习/程序吗?

谢谢!

Jer*_*nks 12

在大数据中,确实没有删除.也就是说,如果表格或分区不是太大,您可以覆盖它们,或者将删除与JamCon建议的特定分区隔离开来.

对于不太大的数据集,您可以执行类似的操作

INSERT OVERWRITE TABLE mytable
SELECT * FROM mytable
WHERE ID NOT IN ( 'delete1', 'delete2', 'delete3');
Run Code Online (Sandbox Code Playgroud)