标签: aggregation

Ruby on Rails:将多个列聚合到一个数组中

我正在开发一个Ruby on Rails应用程序,其中一个数据库表有10列(pile_1到pile_10).在模型中访问这些列作为10元素数组会很方便.

感觉我应该能够强迫composed_of做我想做的事,但我无法弄清楚如何做.任何人都可以启发我,或建议一个更好的策略?

ruby arrays ruby-on-rails aggregation

1
推荐指数
1
解决办法
695
查看次数

如何在R中添加新列和聚合值

我是gnuplot的新手,我只是尝试这个,因为我需要学习它.我有三列中的值,其中第一列表示文件名(日期和时间,一小时间隔),其余两列表示两个不同的实体Prop1和Prop2.

Datetime             Prop1        Prop2

20110101_0000.txt     2            5
20110101_0100.txt     2            5
20110101_0200.txt     2            5
...
20110101_2300.txt     2            5
20110201_0000.txt     2            5
20110101_0100.txt     2            5
...
20110201_2300.txt     2            5
...
Run Code Online (Sandbox Code Playgroud)

我需要按一天中的小时(**_ 0100)聚合数据,这是最后四位数字.所以,我想创建另一个名为hour的列,它告诉我当天的小时.这意味着0000 = 0h, 0100 = 1h, ...... 2200 = 22h

然后我想得到每小时Prop1和Prop2的总和,所以最后得到类似的东西.

Hour  Prop1   Prop2
0h     120     104
1h     230     160
...
10h    90      110
...
23h    100    200 
Run Code Online (Sandbox Code Playgroud)

并获得Prop1和Prop2的线图.

plot r data-analysis aggregation

1
推荐指数
1
解决办法
1567
查看次数

选择行和按ID分组并排序n个最新行(按日期)

我有一个select返回的以下数据集:

date          code     
23/01/2012    AA123
24/01/2012    AA123
29/01/2012    AA123
06/07/2012    AA123
17/02/2012    BB123
20/02/2012    BB123
04/06/2012    BB123
Run Code Online (Sandbox Code Playgroud)

select为每个代码提供所有数据(按代码排序).我只想为每个代码返回最近2个日期的行.要返回的数据如下:

date          code     
23/01/2012    AA123
24/01/2012    AA123
17/02/2012    BB123
20/02/2012    BB123
Run Code Online (Sandbox Code Playgroud)

我如何达到预期的效果?我试过用

select date, code
from table
where x,y,z
and rownum < 2 
order by code desc;
Run Code Online (Sandbox Code Playgroud)

但它只返回前2行 -

sql oracle group-by aggregation top-n

1
推荐指数
1
解决办法
458
查看次数

T-SQL:拆分和聚合逗号分隔值

我有下表,每行都有逗号分隔值:

ID
-----------------------------------------------------------------------------
10031,10042
10064,10023,10060,10065,10003,10011,10009,10012,10027,10004,10037,10039
10009
20011,10027,10032,10063,10023,10033,20060,10012,10020,10031,10011,20036,10041
Run Code Online (Sandbox Code Playgroud)

我需要计算每个ID(一个组).

我只是试图避免游标实现,并在没有游标的情况下难以理解如何做到这一点.

任何帮助,将不胜感激 !

t-sql csv aggregation sql-server-2008

1
推荐指数
1
解决办法
5731
查看次数

从data.table聚合返回多个列

我想用它data.table作为替代aggregate()或者ddply(),因为这两种方法不能像希望的那样有效地扩展到大对象.不幸的是,我还没有弄清楚如何让向量返回聚合函数在结果中生成多个列data.table.例如:

# required packages
library(plyr)
library(data.table)

# simulated data
x <- data.table(value=rnorm(100), g=rep(letters[1:5], each=20))

# ddply output that I would like to get from data.table
ddply(data.frame(x), 'g', function(i) quantile(i$value))

 g        0%        25%          50%       75%     100%
 1 a -1.547495 -0.7842795  0.202456288 0.6098762 2.223530
 2 b -1.366937 -0.4418388 -0.085876995 0.7826863 2.236469
 3 c -2.064510 -0.6411390 -0.257526983 0.3213343 1.039053
 4 d -1.773933 -0.5493362 -0.007549273 0.4835467 2.116601
 5 e -0.780976 -0.2315245  0.194869630 0.6698881 2.207800

# not …
Run Code Online (Sandbox Code Playgroud)

r aggregation data.table

1
推荐指数
1
解决办法
2342
查看次数

R中的条件计数和分组

type如果满足条件,我想计算每行有多少行x == 0.在SQL中类似于一个组

这是一个数据示例

  type    x    
search    0 
NULL      0 
public    0
search    1
home      0
home      1
search    0
Run Code Online (Sandbox Code Playgroud)

conditional r count aggregation

1
推荐指数
2
解决办法
3万
查看次数

使用ElasticSearch获取所有可能的类别聚合

我对ElasticSearch很陌生,我认为我在脑子里犯了一些错误,关于它应该如何工作.我无法通过谷歌找到帮助,也不确定是因为我,还是因为ElasticSearch仍然很新.

我们是一家电子商务公司.我们拥有一个坚实的平台,客户可以在其上管理和销售产品.它们可以有多个子平台,并且可以为每个子平台启用/禁用产品.

因此,每个ElasticSearch过滤器(聚合,方面,无论名称是什么 - 我真的可以使用ES字典)都必须默认过滤此子平台ID.对于Solr,我可以查看每个文档应该是什么样子,但到目前为止还没有ES的喜悦.

我认为这将是一些事情

<doc>
  <field name="subplatforms">[1, 120, 360]</field>
  <field name="name">Product 1</field>
  <field name="categories">['Apparel', 'Shoes', 'Nike']</field>
</doc>
Run Code Online (Sandbox Code Playgroud)

这就是Solr中的XML文件应该是什么样子,但是由于ES没有这样的东西,我只是这样写出来的.

要显示每个选定类别的过滤器,搜索将类似于以下内容:

curl -XPOST "http://localhost:9200/products/_search" -d'
{
  "size": 0, 
  "aggregations": {
    "filter": {
      "term": { "category": "Shoes"
      }
    }
  }
}'
Run Code Online (Sandbox Code Playgroud)

对?我们不希望显示类别的存储桶,因为这是在ElasticSearch之外完成的.但是,我们确实希望在桶中显示所选类别中每个可能选择的所有聚合.对于每个具有"鞋子"类别的产品,它应该找到所有可能的聚合(如何定义它们?),如鞋子尺码,鞋带颜色,鞋带类型(扁平/圆形)等.

我很困难,到目前为止,我发现的资源都没有帮助我.新手文档确实缺乏.

aggregation elasticsearch

1
推荐指数
1
解决办法
1300
查看次数

如何将列总和(带条件)添加为新列?

我有一个data.table,具有以下形状:

    Order_ID Item Amount
1:        a   i1      1
2:        a   i2      2
3:        a   i3      3
4:        b   i1      2
5:        b   i3      1
6:        c   i2      3
7:        c   i3      4
Run Code Online (Sandbox Code Playgroud)

所以,有三个订单有一些项目.我想用一个data.table命令做的是添加一个订单的项目总数并在每一行中给出:

    Order_ID Item Amount Total
1:        a   i1      1     6
2:        a   i2      2     6
3:        a   i3      3     6
4:        b   i1      2     3
5:        b   i3      1     3
6:        c   i2      3     7
7:        c   i3      4     7
Run Code Online (Sandbox Code Playgroud)

我通过创建一个新的data.table与第一个合并它来到达那里.但我认为必须有一种更优雅的方式.:)

谢谢你的帮助!

r aggregation data.table

1
推荐指数
1
解决办法
90
查看次数

计算每对项目在SQL中具有相同订单ID的次数

我想找到更频繁订购的skuid对,然后查看这些对.我的SKU表有2列:skuidorderid.例如:

orderid | skuid
--------|---------
1       | a
1       | b
1       | c
3       | a
3       | b   
3       | d   
3       | c   
5       | a   
5       | b
Run Code Online (Sandbox Code Playgroud)

因此,在这种情况下,它将是:skuid(a,b)对出现3次,(a,c),(b,c)对出现2次.

提前致谢.

sql self-join aggregation

1
推荐指数
1
解决办法
97
查看次数

聚合和DDD

我正在开发一个应用DDD原则的项目,我创建了一个类聚合(Account),它将包含类(代理)和(代理),其中(Account)在数据库中有表.我的问题是:

我需要为我的每个实体(帐户,代理和代理)创建一个Repository类和一个Service类,或者我应该创建AccountRepository并在其中执行3个类的插入和搜索?

c# domain-driven-design aggregation

1
推荐指数
1
解决办法
66
查看次数