小编Ali*_*ork的帖子

如何在大查询中过滤日期

我想弄清楚如何在大查询中正确过滤日期。例如在 MS sql 我做:

Select a, b, date from table_1 where date >= '2017-05-01' 
Run Code Online (Sandbox Code Playgroud)

在大查询中,过滤器不起作用,它返回所有记录。我试过

Select a, b, date from table_1 where date >= Date("2017-05-01")
Select a, b, date from table_1 where date >= 2017-05-01
Select a, b, date from table_1 where date >= timestamp('2017-05-01')
Run Code Online (Sandbox Code Playgroud)

这些都没有用。文档提到创建一个分区表,但我不确定这是我需要做的(我希望不是)。

请帮忙 :(

mysql google-bigquery

6
推荐指数
1
解决办法
1万
查看次数

关于级别数据的预测(使用组模型)

我迫切需要帮助:所以我使用dplyr按组运行回归.就是这样的:

regressions <- mtcars %>% group_by(cyl) %>%
do(fit = lm(wt ~ mpg + qsec + gear, .))
Run Code Online (Sandbox Code Playgroud)

我在数据框中得到如下所示的模型:

  ##     cyl     fit
  ##   (dbl)   (chr)
  ## 1     4 <S3:lm>
  ## 2     6 <S3:lm>
  ## 3     8 <S3:lm>
Run Code Online (Sandbox Code Playgroud)

现在我想预测新数据更短(即与我的训练数据不同),并且具有相同的水平.即4,6,8缸.我的问题是:如何使用new/testdata预测每个模型仅指我的测试集中的级别.

 so model cyl 4 only uses data 4 cyl to predict 
model cyl 6 uses data 6 cyl to predict
model cyl 8 uses data 8 cyl to predict
and so on and so forth.enter code here
Run Code Online (Sandbox Code Playgroud)

请记住,测试数据中包含所有级别/组.

有没有更简单的方法来做到这一点.即按级别进行预测.目前我正在尝试在扫帚包中使用扩充,但它并没有真正起作用.它的作用是:它通过我的所有测试数据运行每个模型,同时忽略级别.

请帮忙!我这样做的规模要大得多,需要快速有效的东西.

r

4
推荐指数
1
解决办法
657
查看次数

case when 语句在 bigquery 中不起作用

当我执行 case when 语句时,收到以下错误消息:

No matching signature for operator CASE for argument types: BOOL, FLOAT64, 
STRING at [10:1] 
Run Code Online (Sandbox Code Playgroud)

该声明是:

case when a.datetime between '2015-11-01' and '2016-10-31' then 
a.i_sec_out_to_auth else 'NA' end as PY_resp,
case when a.datetime between '2016-11-01' and '2017-10-31' then 
a.i_sec_out_to_auth  else 'NA' end as CY_resp
Run Code Online (Sandbox Code Playgroud)

我是不是错过了什么。谷歌bigquery还没有完全处理案例吗?

请记住,a.i_sec_out_to_auth 是我的数据集中的一列 float 类型。

google-bigquery

1
推荐指数
1
解决办法
9817
查看次数

标签 统计

google-bigquery ×2

mysql ×1

r ×1