当我尝试在大型数据集上使用 PERCENT_RANK() 时,它会给我一个错误。
SELECT
a2_lngram,
a2_decade,
a2_totalfreq,
a2_totalbooks,
a2_freq, a2_bfreq,
a2_arf,
c_avgarf,
d_arf,
oi,
PERCENT_RANK() OVER (ORDER BY d_arf DESC) plarf
FROM [trigram.trigrams8]
Run Code Online (Sandbox Code Playgroud)
使用目标表和AllowLargeResults 返回:
“查询执行期间超出资源。”
当我将结果限制为几百时,它运行得很好。
JobID:oticyproject1:job_PpTpmMXYETUMiM_2scGgc997JVg 数据集是公共的。
我需要在BigQuery中为行(大约十亿行)数据集添加行号.当我尝试:
SELECT
*
ROW_NUMBER() OVER (ORDER BY d_arf DESC) plarf
FROM [trigram.trigrams8]
Run Code Online (Sandbox Code Playgroud)
我得到"在查询执行期间超出资源.",因为分析/窗口函数需要适合一个节点.
如何在BigQuery中向大型数据集添加行号?