metastore_db在我运行Hive查询的任何目录中创建文件夹.有没有办法metastore_db在定义的位置只有一个并阻止它在整个地方被创建?它有什么关系hive.metastore.local吗?
我想在hive中将数组转换为字符串.我想collect_set数组值转换为字符串而不用[[""]].
select actor, collect_set(date) as grpdate from actor_table group by actor;
Run Code Online (Sandbox Code Playgroud)
这[["2016-07-01", "2016-07-02"]]将成为2016-07-01, 2016-07-02
与SHOW TABLES命令类似,我们是否有任何此类命令列出到目前为止创建的所有数据库?
我在hive表中有默认的db,它包含80个表.
我创建了另外一个数据库,我想将所有表从默认数据库复制到新数据库.
有没有办法我可以从一个数据库复制到其他数据库,而无需创建单个表.
如果有任何解决方案,请告诉我..提前致谢
我是新手.我有一个员工表,其中一列指定了加入日期,我想检索过去3个月加入的员工列表.我知道我们可以使用from_unixtime(unix_timestamp())获取当前日期.我如何计算dateiff?在MS SQL中是否有内置的DATEDIFF()函数?请指教!
基于下面的Hive文档:
重命名表
ALTER TABLE table_name RENAME TO new_table_name;
此语句允许您将表的名称更改为其他名称.
从版本0.6开始,托管表上的重命名也会移动其HDFS位置.(较旧的Hive版本只是在Metastore中重命名了表而没有移动HDFS位置.)
有没有办法重命名表而不改变位置?
我有一个具有以下架构的配置单元表:
COOKIE  | PRODUCT_ID | CAT_ID |    QTY    
1234123   [1,2,3]    [r,t,null]  [2,1,null]
Run Code Online (Sandbox Code Playgroud)
我如何规范化数组,以便得到以下结果
COOKIE  | PRODUCT_ID | CAT_ID |    QTY
1234123   [1]          [r]         [2]
1234123   [2]          [t]         [1] 
1234123   [3]          null       null 
Run Code Online (Sandbox Code Playgroud)
我尝试过以下方法:
select concat_ws('|',visid_high,visid_low) as cookie
,pid
,catid 
,qty
from table
lateral view explode(productid) ptable as pid
lateral view explode(catalogId) ptable2 as catid 
lateral view explode(qty) ptable3 as qty
Run Code Online (Sandbox Code Playgroud)
然而结果是笛卡尔积.
我知道我们可以使用Spark SQL加载镶木地板文件并使用Impala但是想知道我们是否可以使用Hive做同样的事情.我一直在阅读很多文章,但我仍然感到困惑.
简单地说,我有一个镶木地板文件 - 比如users.parquet.现在我对如何从users.parquet加载/插入/导入数据到hive(显然是在表中)感到震惊.
如果我遗漏了明显的东西,请告诉或指出我正确的方向.
https://phdata.io/examples-using-textfile-and-parquet-with-hive-and-impala/
我有一个数据库人员在蜂巢.它的架构如下:
name string,
dob_date int,
dob_month int,
dob_year int.
Run Code Online (Sandbox Code Playgroud)
我已成功将文件中的数据加载到数据库中.
现在我想让人们dob_year=1990进入一张新桌子.
以下代码不起作用:
Select * into people1990 from people where dob_year=1990;
Run Code Online (Sandbox Code Playgroud) 我在hive中有几个表具有相同的前缀,如下所示.
temp_table_name
temp_table_add
temp_table_area
Run Code Online (Sandbox Code Playgroud)
在我的数据库中有几百个像这样的表以及许多其他表.我想删除以"temp_table"开头的表.你们中的任何人都知道任何可以在Hive中执行此操作的查询吗?