小编Fel*_*ffa的帖子

如何使用BigQuery模拟数据透视表?

我需要在列中组织查询结果,就好像它是一个数据透视表.我怎样才能做到这一点?

google-bigquery

6
推荐指数
1
解决办法
5401
查看次数

BigQuery是否支持正则表达式标志?

我想做一个不区分大小写的REGEX_MATCH,我不确定我是否可以使用标志.

regex google-bigquery

6
推荐指数
1
解决办法
1874
查看次数

与 BigQuery SQL 的余弦相似度?

我在 BigQuery 中存储了向量(请参阅如何使用 SQL (BigQuery) 计算 TF/IDF),并且我想找到它们之间最相似的向量。如何使用 BigQuery 标准 SQL 计算余弦相似度?

sql vector google-bigquery

6
推荐指数
1
解决办法
4936
查看次数

如何在BigQuery(或迷你图或颜色渐变)中构建"星级"报告

假设我有以下示例输入:

WITH Ratings AS (
    (SELECT 'A' name, 2 score) UNION ALL
    (SELECT 'B' name, 0 score) UNION ALL
    (SELECT 'C' name, 5 score) UNION ALL
    (SELECT 'D' name, 1 score))
Run Code Online (Sandbox Code Playgroud)

score0到5之间的数字在哪里.如何生成显示名称和相应星数的报告?

google-bigquery

6
推荐指数
2
解决办法
621
查看次数

如何根据另一列的聚合获得一列对应的值?

我正在将一些 PostgreSQL 查询迁移到 Snowflake,并且正在努力复制以下查询:

WITH test_table(col1, col2, col3, col4) AS (
    VALUES 
        (1, 1, 7, 5),
        (1, 1, 6, 4),
        (1, 2, 1, 4),
        (1, 2, 2, 5),
        (1, 2, 3, 6)
)

SELECT
    col1,
    col2,
    (max(ARRAY[col3, col4]))[2]
FROM test_table
GROUP BY 1, 2
Run Code Online (Sandbox Code Playgroud)

col4此查询设法获取与 的最大值相对应的值col3 grouped by col1, col2。然而,我没有找到任何优雅的解决方案来在 Snowflake 上复制这一点。

sql greatest-n-per-group maxby snowflake-cloud-data-platform

6
推荐指数
1
解决办法
1610
查看次数

如何防止人们在 Snowflake 表上运行 SELECT *?

出于合规性原因,我们希望阻止 SQL 分析师SELECT *在表上运行。相反,我们希望强制他们明确询问他们想要选择的列。我如何使用 Snowflake 来强制执行此操作?

我看到 SQL Server 使用计算列的提示,Snowflake 有等效的吗?

在此输入图像描述

sql snowflake-cloud-data-platform

6
推荐指数
3
解决办法
1134
查看次数

如何将压缩文件加载到BigQuery中

我想将http://dumps.wikimedia.org/other/pagecounts-raw/上的维基百科综合浏览量上传到BigQuery,最快的方法是什么?

google-bigquery

5
推荐指数
1
解决办法
2499
查看次数

我每天都有关于BigQuery的表格.如何查询"最新"的?

我创建每日表.如何查询"最新"的?

例如,GitHubArchive现在发布每日表 - 而不是单一表(参见/r/bigquery/.../github_archive_changes_monthly_and_daily_tables/).

google-bigquery

5
推荐指数
1
解决办法
1414
查看次数

如何在 BigQuery 中获取随机整数?

我想在 BigQuery 中获取 0 到 9 之间的随机整数。我尝试过经典的

SELECT CAST(10*RAND() AS INT64)
Run Code Online (Sandbox Code Playgroud)

但它产生 0 到 10 之间的数字

添加这个问题作为结果可能会让习惯在大多数其他语言中CAST执行此操作的程序员感到惊讶TRUNC

请注意这种奇怪的结果分布:

在此输入图像描述

random google-bigquery

5
推荐指数
2
解决办法
2万
查看次数

加载到Google Big Query时出现JSON格式错误

我正在尝试使用内置的数据流模板从PUBSUB加载Big Query中的以下数据:

{
    "current_speed": "19.09",
    "_east": "-87.654561",
    "_last_updt": "2018-07-17 15:50:54.0",
    "_region_id": "1",
    "_north": "42.026444",
    "_south": "41.997946",
    "region": "Rogers Park - West Ridge",
    "_west": "-87.709645",
    "_description": "North of Devon. Kedzie to Lake Shore"
}
Run Code Online (Sandbox Code Playgroud)

但我一直收到这个错误:

"读取数据时出错,错误消息:无法解析JSON:字符串意外结束;字符串意外结束;预期键"

我实际上需要加载更大的数据集,如下所示:

 [{
    "current_speed": "19.09",
    "_east": "-87.654561",
    "_last_updt": "2018-07-17 15:50:54.0",
    "_region_id": "1",
    "_north": "42.026444",
    "_south": "41.997946",
    "region": "Rogers Park - West Ridge",
    "_west": "-87.709645",
    "_description": "North of Devon. Kedzie to Lake Shore"
}, {
    "current_speed": "25.23",
    "_east": "-87.747456",
    "_last_updt": "2018-07-17 15:50:54.0",
    "_region_id": "2",
    "_north": "42.0190998",
    "_south": …
Run Code Online (Sandbox Code Playgroud)

json google-bigquery

5
推荐指数
2
解决办法
5918
查看次数