计算雪花比例的最佳方法是什么

Viv*_*rma 0 snowflake-schema snowflake-cloud-data-platform

假设我有某种离散变量,比如说一个字符串,我想知道该字符串的每个值出现的比例。Snowflake 有推荐的方法吗?

Luk*_*zda 10

Snowflake 支持RATIO_TO_REPORT

返回组内值与组内值之和的比率

SELECT C_SALUTATION,
       RATIO_TO_REPORT(COUNT(*)) OVER() AS ratio
FROM "SNOWFLAKE_SAMPLE_DATA"."TPCDS_SF100TCL".CUSTOMER
GROUP BY C_SALUTATION;
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述