1)我从最近2个月开始使用蜂巢.我和SQL中的任务相同.我发现Hive很慢并且需要更多时间来执行查询,而SQL在几分钟/秒内执行查询.
在Hive中执行任务后,当我在两者(SQL和Hive)中交叉检查结果时,我发现结果有些不同(并非在所有表中都有).例如:我有一张表有2012年的记录,当我在Hive的Hive中执行任务时,我得到了2007年的记录.
为什么会这样?
2)如果我想加速我在Hive中的执行,那么我该怎么做呢?(目前我只在单个集群上执行所有这些东西.如果我想增加集群,那么我需要多少集群才能提高性能)
请建议我一些解决方案或一些好的做法,以便我能够敏锐地做到这一点.
谢谢.
Hive 与常规 SQL 确实存在一些差异,这些差异可能会影响您的查询。没有更多细节,我无法推测原因。
| 归档时间: |
|
| 查看次数: |
6787 次 |
| 最近记录: |