如何在 Google BigQuery SQL 中执行 LAG 和 LEAD?

Sha*_*ong 1 sql lag lead google-bigquery

是否有函数或方法可以在 Google Big Query SQL 中执行 LEAD & LAG 来预测新客户、回头客和流失客户?

我的桌子

 Order_ID | Date_Start | Date_End |  
 001      | 2020-1-1   | 2020-2-1 | 
 001      | 2020-2-1   | 2020-3-1 | 
 001      | 2020-3-1   | 2020-4-1 | 
Run Code Online (Sandbox Code Playgroud)

预期输出:

 Order_ID | Date_Start | Date_End | Churn_Status    
 001      | 2020-1-1   | 2020-2-1 | New Customer
 001      | 2020-2-1   | 2020-3-1 | Recurring 
 001      | 2020-3-1   | 2020-4-1 | Churned
Run Code Online (Sandbox Code Playgroud)

谢谢。任何帮助你都是有用的。

Gor*_*off 5

如果我理解正确的话,你可以这样做:

select t.*,
       (case when lag(order_id) over (partition by order_id order by date_start) is null
             then 'New Customer'
             when lead(order_id) over (partition by order_id order by date_start) is null
             then 'Churned'
             else 'Recurring'
        end) as churn_status
from t;
Run Code Online (Sandbox Code Playgroud)

我将逻辑解释为:

  • 如果order_id没有以前的记录,则状态为“新客户”。
  • 如果order_id没有后续记录,则状态为“已流失”。
  • 如果上一条记录和下一条记录都存在,则状态为“重复”。