小编She*_*Rey的帖子

记录所有BigQuery查询

是否可以将所有BigQuery请求记录到云存储中的文件中(甚至更好地记录到BigQuery表中)?似乎bq中提供的--apilog选项主要用于调试目的,但我想要做的是跟踪所有查询,就像在CloudStorage中记录特定文件上的所有访问请求一样.

更具体地说,我不仅想记录我自己的查询,而且(a)同一项目中所有用户的查询,并且最佳地(b)任何人触摸我拥有的数据集中的表的查询.

google-bigquery

6
推荐指数
2
解决办法
2181
查看次数

如何在BigQuery的标准SQL中实现RATIO_TO_REPORT()?

我有一个使用RATIO_TO_REPORT()的遗留SQL查询 - 它不使用开放访问表,但它是这样的:

SELECT
  Mutation_AA,
  Gene_name,
  CaseCount,
  RATIO_TO_REPORT(CaseCount) OVER (PARTITION BY Gene_name) AS ratio
FROM (
  SELECT
    COUNT(DISTINCT ID_tumour, 50000) AS CaseCount,
    Mutation_AA,
    Gene_name
  FROM
    [isb-cgc:COSMIC.grch38_v79]
  GROUP BY
    Mutation_AA,
    Gene_name )
Run Code Online (Sandbox Code Playgroud)

我正在尝试从遗留SQL迁移到标准SQL(在使用BigQuery之前从未使用过SQL),因此非常感谢提示!谢谢

google-bigquery

4
推荐指数
1
解决办法
3464
查看次数

BigQuery:计算列的熵

我对BQ人员有一个建议:我认为如果有一个内置函数可以返回列的熵,那将非常有用.一列离散的类别或值将相对容易.思考?这已经存在但我找不到了吗?

entropy google-bigquery

3
推荐指数
1
解决办法
1489
查看次数

标签 统计

google-bigquery ×3

entropy ×1