如果 y 条件为真,如何计算特征 x (bigquery)

Bru*_*nha 4 sql r machine-learning google-bigquery

我是机器学习的新手,我正在解决我的第一个机器学习问题。我自己做了很多研究,但找不到这个问题的解决方案。

我正在从 Bigquery 的数据集中创建新变量。如果满足变量 (y) 中的条件,则变量之一包括对变量 (x) 进行计数。我不能使用 WHERE 或 HAVING,因为条件仅与此特定变量的计算有关。

代码或多或少是这样的:

COUNT(DISTINCT sessionid IF(date > “2018-06-01” && date < “2018-06-30”)) 
AS sessions_lastmonth
Run Code Online (Sandbox Code Playgroud)

我知道这段代码不正确,不可能,但只是表达或多或少我需要的一种方式。目标是知道某个时间段内的会话数。我不能使用日期计数,因为在一天内您可以有多个会话,并且不是每一行都是不同的会话(一个会话可以有几行,因为用户可以在同一个会话中浏览许多页面)。

谢谢!

Mik*_*ant 10

下面是 BigQuery 标准 SQL

COUNT(DISTINCT IF(date >= '2018-06-01' AND date <= '2018-06-30', sessionid, NULL)) AS sessions_lastmonth
Run Code Online (Sandbox Code Playgroud)

  • 米哈伊尔,非常感谢!代码完美运行!顺便说一句,这段代码对于许多其他计算也非常方便! (2认同)