我正在开发一个Ruby on Rails应用程序,其中一个数据库表有10列(pile_1到pile_10).在模型中访问这些列作为10元素数组会很方便.
感觉我应该能够强迫composed_of做我想做的事,但我无法弄清楚如何做.任何人都可以启发我,或建议一个更好的策略?
我是gnuplot的新手,我只是尝试这个,因为我需要学习它.我有三列中的值,其中第一列表示文件名(日期和时间,一小时间隔),其余两列表示两个不同的实体Prop1和Prop2.
Datetime Prop1 Prop2
20110101_0000.txt 2 5
20110101_0100.txt 2 5
20110101_0200.txt 2 5
...
20110101_2300.txt 2 5
20110201_0000.txt 2 5
20110101_0100.txt 2 5
...
20110201_2300.txt 2 5
...
Run Code Online (Sandbox Code Playgroud)
我需要按一天中的小时(**_ 0100)聚合数据,这是最后四位数字.所以,我想创建另一个名为hour的列,它告诉我当天的小时.这意味着0000 = 0h, 0100 = 1h, ...... 2200 = 22h等
然后我想得到每小时Prop1和Prop2的总和,所以最后得到类似的东西.
Hour Prop1 Prop2
0h 120 104
1h 230 160
...
10h 90 110
...
23h 100 200
Run Code Online (Sandbox Code Playgroud)
并获得Prop1和Prop2的线图.
我有一个select返回的以下数据集:
date code
23/01/2012 AA123
24/01/2012 AA123
29/01/2012 AA123
06/07/2012 AA123
17/02/2012 BB123
20/02/2012 BB123
04/06/2012 BB123
Run Code Online (Sandbox Code Playgroud)
select为每个代码提供所有数据(按代码排序).我只想为每个代码返回最近2个日期的行.要返回的数据如下:
date code
23/01/2012 AA123
24/01/2012 AA123
17/02/2012 BB123
20/02/2012 BB123
Run Code Online (Sandbox Code Playgroud)
我如何达到预期的效果?我试过用
select date, code
from table
where x,y,z
and rownum < 2
order by code desc;
Run Code Online (Sandbox Code Playgroud)
但它只返回前2行 -
我有下表,每行都有逗号分隔值:
ID
-----------------------------------------------------------------------------
10031,10042
10064,10023,10060,10065,10003,10011,10009,10012,10027,10004,10037,10039
10009
20011,10027,10032,10063,10023,10033,20060,10012,10020,10031,10011,20036,10041
Run Code Online (Sandbox Code Playgroud)
我需要计算每个ID(一个组).
我只是试图避免游标实现,并在没有游标的情况下难以理解如何做到这一点.
任何帮助,将不胜感激 !
我想用它data.table作为替代aggregate()或者ddply(),因为这两种方法不能像希望的那样有效地扩展到大对象.不幸的是,我还没有弄清楚如何让向量返回聚合函数在结果中生成多个列data.table.例如:
# required packages
library(plyr)
library(data.table)
# simulated data
x <- data.table(value=rnorm(100), g=rep(letters[1:5], each=20))
# ddply output that I would like to get from data.table
ddply(data.frame(x), 'g', function(i) quantile(i$value))
g 0% 25% 50% 75% 100%
1 a -1.547495 -0.7842795 0.202456288 0.6098762 2.223530
2 b -1.366937 -0.4418388 -0.085876995 0.7826863 2.236469
3 c -2.064510 -0.6411390 -0.257526983 0.3213343 1.039053
4 d -1.773933 -0.5493362 -0.007549273 0.4835467 2.116601
5 e -0.780976 -0.2315245 0.194869630 0.6698881 2.207800
# not …Run Code Online (Sandbox Code Playgroud) type如果满足条件,我想计算每行有多少行x == 0.在SQL中类似于一个组
这是一个数据示例
type x
search 0
NULL 0
public 0
search 1
home 0
home 1
search 0
Run Code Online (Sandbox Code Playgroud) 我对ElasticSearch很陌生,我认为我在脑子里犯了一些错误,关于它应该如何工作.我无法通过谷歌找到帮助,也不确定是因为我,还是因为ElasticSearch仍然很新.
我们是一家电子商务公司.我们拥有一个坚实的平台,客户可以在其上管理和销售产品.它们可以有多个子平台,并且可以为每个子平台启用/禁用产品.
因此,每个ElasticSearch过滤器(聚合,方面,无论名称是什么 - 我真的可以使用ES字典)都必须默认过滤此子平台ID.对于Solr,我可以查看每个文档应该是什么样子,但到目前为止还没有ES的喜悦.
我认为这将是一些事情
<doc>
<field name="subplatforms">[1, 120, 360]</field>
<field name="name">Product 1</field>
<field name="categories">['Apparel', 'Shoes', 'Nike']</field>
</doc>
Run Code Online (Sandbox Code Playgroud)
这就是Solr中的XML文件应该是什么样子,但是由于ES没有这样的东西,我只是这样写出来的.
要显示每个选定类别的过滤器,搜索将类似于以下内容:
curl -XPOST "http://localhost:9200/products/_search" -d'
{
"size": 0,
"aggregations": {
"filter": {
"term": { "category": "Shoes"
}
}
}
}'
Run Code Online (Sandbox Code Playgroud)
对?我们不希望显示类别的存储桶,因为这是在ElasticSearch之外完成的.但是,我们确实希望在桶中显示所选类别中每个可能选择的所有聚合.对于每个具有"鞋子"类别的产品,它应该找到所有可能的聚合(如何定义它们?),如鞋子尺码,鞋带颜色,鞋带类型(扁平/圆形)等.
我很困难,到目前为止,我发现的资源都没有帮助我.新手文档确实缺乏.
我有一个data.table,具有以下形状:
Order_ID Item Amount
1: a i1 1
2: a i2 2
3: a i3 3
4: b i1 2
5: b i3 1
6: c i2 3
7: c i3 4
Run Code Online (Sandbox Code Playgroud)
所以,有三个订单有一些项目.我想用一个data.table命令做的是添加一个订单的项目总数并在每一行中给出:
Order_ID Item Amount Total
1: a i1 1 6
2: a i2 2 6
3: a i3 3 6
4: b i1 2 3
5: b i3 1 3
6: c i2 3 7
7: c i3 4 7
Run Code Online (Sandbox Code Playgroud)
我通过创建一个新的data.table与第一个合并它来到达那里.但我认为必须有一种更优雅的方式.:)
谢谢你的帮助!
我想找到更频繁订购的skuid对,然后查看这些对.我的SKU表有2列:skuid和orderid.例如:
orderid | skuid
--------|---------
1 | a
1 | b
1 | c
3 | a
3 | b
3 | d
3 | c
5 | a
5 | b
Run Code Online (Sandbox Code Playgroud)
因此,在这种情况下,它将是:skuid(a,b)对出现3次,(a,c),(b,c)对出现2次.
提前致谢.
我正在开发一个应用DDD原则的项目,我创建了一个类聚合(Account),它将包含类(代理)和(代理),其中(Account)在数据库中有表.我的问题是:
我需要为我的每个实体(帐户,代理和代理)创建一个Repository类和一个Service类,或者我应该创建AccountRepository并在其中执行3个类的插入和搜索?