标签: hiveql

在我运行Hive的任何地方都创建了metastore_db

metastore_db在我运行Hive查询的任何目录中创建文件夹.有没有办法metastore_db在定义的位置只有一个并阻止它在整个地方被创建?它有什么关系hive.metastore.local吗?

hive hiveql

21
推荐指数
2
解决办法
2万
查看次数

如何在hive sql中将数组转换为字符串?

我想在hive中将数组转换为字符串.我想collect_set数组值转换为字符串而不用[[""]].

select actor, collect_set(date) as grpdate from actor_table group by actor;
Run Code Online (Sandbox Code Playgroud)

[["2016-07-01", "2016-07-02"]]将成为2016-07-01, 2016-07-02

arrays string hive hiveql

21
推荐指数
1
解决办法
4万
查看次数

如何列出目前正在使用或创建的所有配置单元数据库?

SHOW TABLES命令类似,我们是否有任何此类命令列出到目前为止创建的所有数据库?

hadoop hive hiveql

20
推荐指数
1
解决办法
5万
查看次数

如何将所有配置单元表从一个数据库复制到其他数据库

我在hive表中有默认的db,它包含80个表.
我创建了另外一个数据库,我想将所有表从默认数据库复制到新数据库.

有没有办法我可以从一个数据库复制到其他数据库,而无需创建单个表.

如果有任何解决方案,请告诉我..提前致谢

hive hiveql impala

20
推荐指数
2
解决办法
5万
查看次数

如何计算Hive中的日期差异

我是新手.我有一个员工表,其中一列指定了加入日期,我想检索过去3个月加入的员工列表.我知道我们可以使用from_unixtime(unix_timestamp())获取当前日期.我如何计算dateiff?在MS SQL中是否有内置的DATEDIFF()函数?请指教!

hadoop hive hiveql

18
推荐指数
2
解决办法
8万
查看次数

如何在不更改位置的情况下重命名配置单元表?

基于下面的Hive文档:

重命名表

ALTER TABLE table_name RENAME TO new_table_name;

此语句允许您将表的名称更改为其他名称.

从版本0.6开始,托管表上的重命名也会移动其HDFS位置.(较旧的Hive版本只是在Metastore中重命名了表而没有移动HDFS位置.)

有没有办法重命名表而不改变位置?

hadoop hive hiveql

17
推荐指数
3
解决办法
6万
查看次数

Hive Explode/Lateral查看多个数组

我有一个具有以下架构的配置单元表:

COOKIE  | PRODUCT_ID | CAT_ID |    QTY    
1234123   [1,2,3]    [r,t,null]  [2,1,null]
Run Code Online (Sandbox Code Playgroud)

我如何规范化数组,以便得到以下结果

COOKIE  | PRODUCT_ID | CAT_ID |    QTY

1234123   [1]          [r]         [2]

1234123   [2]          [t]         [1] 

1234123   [3]          null       null 
Run Code Online (Sandbox Code Playgroud)

我尝试过以下方法:

select concat_ws('|',visid_high,visid_low) as cookie
,pid
,catid 
,qty
from table
lateral view explode(productid) ptable as pid
lateral view explode(catalogId) ptable2 as catid 
lateral view explode(qty) ptable3 as qty
Run Code Online (Sandbox Code Playgroud)

然而结果是笛卡尔积.

hive explode hiveql

16
推荐指数
3
解决办法
4万
查看次数

我们可以直接将Parquet文件加载到Hive吗?

我知道我们可以使用Spark SQL加载镶木地板文件并使用Impala但是想知道我们是否可以使用Hive做同样的事情.我一直在阅读很多文章,但我仍然感到困惑.

简单地说,我有一个镶木地板文件 - 比如users.parquet.现在我对如何从users.parquet加载/插入/导入数据到hive(显然是在表中)感到震惊.

如果我遗漏了明显的东西,请告诉或指出我正确的方向.

使用镶木地板文件元数据创建配置表

https://phdata.io/examples-using-textfile-and-parquet-with-hive-and-impala/

hadoop hive hiveql parquet apache-spark-sql

16
推荐指数
3
解决办法
4万
查看次数

Hive Select Into

我有一个数据库人员在蜂巢.它的架构如下:

name string,
dob_date int,
dob_month int,
dob_year int.
Run Code Online (Sandbox Code Playgroud)

我已成功将文件中的数据加载到数据库中.
现在我想让人们dob_year=1990进入一张新桌子.
以下代码不起作用:

Select * into people1990 from people where dob_year=1990;
Run Code Online (Sandbox Code Playgroud)

hive hiveql

14
推荐指数
1
解决办法
2万
查看次数

在Hive中删除具有相同前缀的多个表

我在hive中有几个表具有相同的前缀,如下所示.

temp_table_name
temp_table_add
temp_table_area
Run Code Online (Sandbox Code Playgroud)

在我的数据库中有几百个像这样的表以及许多其他表.我想删除以"temp_table"开头的表.你们中的任何人都知道任何可以在Hive中执行此操作的查询吗?

hadoop hive hiveql

13
推荐指数
3
解决办法
2万
查看次数

标签 统计

hive ×10

hiveql ×10

hadoop ×5

apache-spark-sql ×1

arrays ×1

explode ×1

impala ×1

parquet ×1

string ×1