我想知道如何找到Hive表与它们所代表的实际HDFS文件(或更确切地说,目录)之间的映射.我需要直接访问表文件.
Hive将文件存储在HDFS中的哪个位置?
在Hive中,当我们执行查询(如:)时   select * from employee,我们在输出中没有得到任何列名(比如我们在RDBMS SQL中获得的名称,年龄,工资),我们只获取值.
在执行任何查询时,有没有办法让列名与输出一起显示?
INNER JOIN和之间有什么区别LEFT SEMI JOIN?
在下面的场景中,为什么我得到两个不同的结果?
该INNER JOIN结果集是很多大.谁能解释一下?我试图让其中的名字table_1只出现在table_2.
SELECT name
FROM table_1 a
    INNER JOIN table_2 b ON a.name=b.name
SELECT name
FROM table_1 a
    LEFT SEMI JOIN table_2 b ON (a.name=b.name)
Run Code Online (Sandbox Code Playgroud) 是否可以将DataFrame火花直接保存到Hive中.
我已尝试转换DataFrame为Rdd然后保存为文本文件,然后加载到配置单元.但我想知道我是否可以直接保存dataframe到蜂巢
我们如何在Hive中获取当前系统日期?在MySQL中我们选择now(),任何人都可以帮我获取查询结果.我对Hive很新,是否有适当的Hive文档,它提供了有关伪列和内置函数的详细信息.
我已经安装了Hadoop,Hive,Hive JD BC.这对我来说运行良好.但我还是有问题.如何使用Hive删除或更新单个记录,因为MySQL的删除或更新命令在配置单元中不起作用.
谢谢
hive> delete from student where id=1;
Usage: delete [FILE|JAR|ARCHIVE] <value> [<value>]*
Query returned non-zero code: 1, cause: null
Run Code Online (Sandbox Code Playgroud) 我有一个包含1000多个分区的表.
" Show partitions"命令仅列出少量分区.
我该如何显示所有分区?
更新:
我发现" show partitions"命令只列出了500个分区.
" select ... where ..."只处理500个分区!
我有兴趣了解最近发布的(http://mirror.facebook.com/facebook/hive/hadoop-0.17/)Hive在性能方面与HBase的比较.Hive使用的类似SQL的接口比我们实现的HBase API要好得多.
我使用此Hive查询将表导出为CSV文件.
INSERT OVERWRITE DIRECTORY '/user/data/output/test' select column1, column2 from table1;
Run Code Online (Sandbox Code Playgroud)
生成的文件'000000_0'没有逗号分隔符
这是生成CSV文件的正确方法吗?如果不是,请告诉我如何生成CSV文件?