小编San*_*ver的帖子

具有多个分区的 Hive 表

我有一个表(data_table),其中包含多个分区列年/月/月键。

目录看起来像year=2017/month=08/monthkey=2017-08/files.parquet

下面哪个查询会更快?

select count(*) from data_table where monthkey='2017-08'

或者

select count(*) from data_table where monthkey='2017-08' and year = '2017' and month = '08'

我认为在第一种情况下 hadoop take 查找所需目录所需的初始时间会更多。但想确认一下

hive hiveql

2
推荐指数
1
解决办法
1万
查看次数

标签 统计

hive ×1

hiveql ×1