Bru*_*nha 4 sql r machine-learning google-bigquery
我是机器学习的新手,我正在解决我的第一个机器学习问题。我自己做了很多研究,但找不到这个问题的解决方案。
我正在从 Bigquery 的数据集中创建新变量。如果满足变量 (y) 中的条件,则变量之一包括对变量 (x) 进行计数。我不能使用 WHERE 或 HAVING,因为条件仅与此特定变量的计算有关。
代码或多或少是这样的:
COUNT(DISTINCT sessionid IF(date > “2018-06-01” && date < “2018-06-30”))
AS sessions_lastmonth
Run Code Online (Sandbox Code Playgroud)
我知道这段代码不正确,不可能,但只是表达或多或少我需要的一种方式。目标是知道某个时间段内的会话数。我不能使用日期计数,因为在一天内您可以有多个会话,并且不是每一行都是不同的会话(一个会话可以有几行,因为用户可以在同一个会话中浏览许多页面)。
谢谢!
Mik*_*ant 10
下面是 BigQuery 标准 SQL
COUNT(DISTINCT IF(date >= '2018-06-01' AND date <= '2018-06-30', sessionid, NULL)) AS sessions_lastmonth
Run Code Online (Sandbox Code Playgroud)