相关疑难解决方法(0)

使用HiveQL(Hadoop)在Hive中连接两个表

可能重复:
SQL Query JOIN with Table

CREATE EXTERNAL TABLE IF NOT EXISTS TestingTable1   (This is the MAIN table through which comparisons need to be made)
(
BUYER_ID BIGINT,
ITEM_ID BIGINT,
CREATED_TIME STRING
)
Run Code Online (Sandbox Code Playgroud)

这是上面第一个表格中的数据

**BUYER_ID**  |  **ITEM_ID**     |      **CREATED_TIME**   
--------------+------------------+-------------------------
 1015826235      220003038067       *2001-11-03 19:40:21*
 1015826235      300003861266        2001-11-08 18:19:59
 1015826235      140002997245        2003-08-22 09:23:17
 1015826235     *210002448035*       2001-11-11 22:21:11
Run Code Online (Sandbox Code Playgroud)

这是Hive中的第二个表 - 它还包含有关我们正在购买的项目的信息.

CREATE EXTERNAL TABLE IF NOT EXISTS TestingTable2
(
USER_ID BIGINT,
PURCHASED_ITEM ARRAY<STRUCT<PRODUCT_ID: BIGINT,TIMESTAMPS:STRING>>
)
Run Code Online (Sandbox Code Playgroud)

这是上面第二个表(TestingTable2)中的数据 -

**USER_ID**    **PURCHASED_ITEM**
1015826235 …
Run Code Online (Sandbox Code Playgroud)

sql hadoop hive mapreduce hiveql

5
推荐指数
1
解决办法
6万
查看次数

标签 统计

hadoop ×1

hive ×1

hiveql ×1

mapreduce ×1

sql ×1