hive中的percentile_approx返回零

Rak*_*ama 5 hadoop hive

我一直在尝试检查一组用户的percentile_approx.这背后的意图是在数据集中获得前25%的客户.所以,为了检查,我运行了以下HIVE查询.

select percentile_approx(amount, 0.75)
from sales
Run Code Online (Sandbox Code Playgroud)

但是,此查询返回的值是0.0.我不确定问题是什么.当我对几条记录的样本运行此查询时,结果就是预期的结果.

任何人都可以对此有所了解吗?

注意 - 我试图在包含超过3.3 M记录的数据集中找到百分位数.

小智 -1

select percentile_approx(cast(amount as double), ARRAY(0.75))
from sales
Run Code Online (Sandbox Code Playgroud)

试试这个方法