小编une*_*ner的帖子

BigQuery 中的 PERCENT_RANK() 返回超出资源

当我尝试在大型数据集上使用 PERCENT_RANK() 时,它会给我一个错误。

SELECT 
  a2_lngram, 
  a2_decade, 
  a2_totalfreq, 
  a2_totalbooks, 
  a2_freq, a2_bfreq, 
  a2_arf, 
  c_avgarf, 
  d_arf, 
  oi, 
  PERCENT_RANK() OVER (ORDER BY d_arf DESC) plarf 
FROM [trigram.trigrams8]
Run Code Online (Sandbox Code Playgroud)

使用目标表和AllowLargeResults 返回:

“查询执行期间超出资源。”

当我将结果限制为几百时,它运行得很好。

JobID:oticyproject1:job_PpTpmMXYETUMiM_2scGgc997JVg 数据集是公共的。

google-bigquery

5
推荐指数
1
解决办法
7934
查看次数

BigQuery中的RANK或ROW_NUMBER在大型数据集上

我需要在BigQuery中为行(大约十亿行)数据集添加行号.当我尝试:

SELECT 
  *
  ROW_NUMBER() OVER (ORDER BY d_arf DESC) plarf 
FROM [trigram.trigrams8]
Run Code Online (Sandbox Code Playgroud)

我得到"在查询执行期间超出资源.",因为分析/窗口函数需要适合一个节点.

如何在BigQuery中向大型数据集添加行号?

row-number large-data google-bigquery

4
推荐指数
1
解决办法
7254
查看次数

标签 统计

google-bigquery ×2

large-data ×1

row-number ×1