在 Bigquery 和云数据实验室中查询重复记录

Siv*_*sad 5 google-bigquery

我有一个表 EMP,其中包含 Empno、Name、Age 作为常规字段。

EMP.Salary 作为 RECORD,具有重复类型,具有两个字段“月份”和“金额”

EmpNo: 1
Age : 25
Name : Alex

Salary.Month : Jan
Salary.Amt : 2000

Salary.Month : Feb
Salary.Amt : 3000

Salary.Month : Mar
Salary.Amt : 3500

Emp No: 2
Age : 26
Name : Teresa

Salary.Month : Jan
Salary.Amt : 1000

Salary.Month : Feb
Salary.Amt : 2000

Salary.Month : Mar
Salary.Amt : 3000
Run Code Online (Sandbox Code Playgroud)

如何在 Bigquery 中使用标准 sql 来获取这些重复的项目?

问候, 西瓦

Mik*_*ant 7

我需要 biqQuery 来获取以下输出。员工编号 姓名 月薪 1 Alex Jan 2000 1 Alex Feb 3000 1 Alex Mar 3500 2 Teresa Jan 1000 2 Teresa Feb 2000 2 Teresa Feb 3000

以下是 BigQuery 标准 SQL

#standardSQL
SELECT EmpNo, Age, Name, s.*
FROM `project.dataset.your_table` t, UNNEST(Salary) s
Run Code Online (Sandbox Code Playgroud)

您可以使用问题中的虚拟数据来测试/使用它,如下所示

#standardSQL
WITH `project.dataset.your_table` AS (
  SELECT 1 EmpNo, 25 Age, 'Alex' Name, 
    [STRUCT<Month STRING, Amt INT64>('Jan', 2000), ('Feb', 3000), ('Mar', 3500)] Salary UNION ALL
  SELECT 2, 26, 'Teresa',
    [STRUCT<Month STRING, Amt INT64>('Jan', 1000), ('Feb', 2000), ('Mar', 3000)] 
)
SELECT EmpNo, Age, Name, s.*
FROM `project.dataset.your_table` t, UNNEST(Salary) s
Run Code Online (Sandbox Code Playgroud)

结果是

Row EmpNo   Age Name    Month   Amt  
1   1       25  Alex    Jan     2000     
2   1       25  Alex    Feb     3000     
3   1       25  Alex    Mar     3500     
4   2       26  Teresa  Jan     1000     
5   2       26  Teresa  Feb     2000     
6   2       26  Teresa  Mar     3000     
Run Code Online (Sandbox Code Playgroud)

我需要empno、姓名和工资总额的详细信息

如果您需要工资总和,您可以使用下面的示例

#standardSQL
WITH `project.dataset.your_table` AS (
  SELECT 1 EmpNo, 25 Age, 'Alex' Name, 
    [STRUCT<Month STRING, Amt INT64>('Jan', 2000), ('Feb', 3000), ('Mar', 3500)] Salary UNION ALL
  SELECT 2, 26, 'Teresa',
    [STRUCT<Month STRING, Amt INT64>('Jan', 1000), ('Feb', 2000), ('Mar', 3000)] 
)
SELECT EmpNo, Age, Name, 
  (SELECT SUM(Amt) FROM UNNEST(Salary)) Total
FROM `project.dataset.your_table`
Run Code Online (Sandbox Code Playgroud)

结果是

Row EmpNo   Age Name    Total    
1   1       25  Alex    8500     
2   2       26  Teresa  6000     
Run Code Online (Sandbox Code Playgroud)