我知道在hive中没有直接的方法来转置数据.我遵循了这个问题:有没有办法在Hive中转置数据?,但由于那里没有最终的答案,无法一路走来.
这是我的表格:
| ID | Code | Proc1 | Proc2 |
| 1 | A | p | e |
| 2 | B | q | f |
| 3 | B | p | f |
| 3 | B | q | h |
| 3 | B | r | j |
| 3 | C | t | k |
Run Code Online (Sandbox Code Playgroud)
这里Proc1可以有任意数量的值.ID,Code和Proc1一起构成此表的唯一键.我想透视/转置此表,以便Proc1中的每个唯一值成为新列,并且Proc2中的相应值是该列中相应行的值.在本质上,我试图得到类似的东西:
| ID | Code | p | q | r | t …Run Code Online (Sandbox Code Playgroud) 我是hadoop&hive的新手.我想删除我的数据库中的某些行 - 这是在hive-hadoop上.我知道它不支持开箱即用,而hadoop是一个只读文件系统.我很好奇有什么是实现这一目标的最佳方法.如果有人以前这样做过,他们可以分享他们的学习/程序吗?
谢谢!