jba*_*g10 10 python group-by list-comprehension
鉴于以下列表:
[
('A', '', Decimal('4.0000000000'), 1330, datetime.datetime(2012, 6, 8, 0, 0)),
('B', '', Decimal('31.0000000000'), 1330, datetime.datetime(2012, 6, 4, 0, 0)),
('AA', 'C', Decimal('31.0000000000'), 1330, datetime.datetime(2012, 5, 31, 0, 0)),
('B', '', Decimal('7.0000000000'), 1330, datetime.datetime(2012, 5, 24, 0, 0)),
('A', '', Decimal('21.0000000000'), 1330, datetime.datetime(2012, 5, 14, 0, 0))
]
Run Code Online (Sandbox Code Playgroud)
我想通过元组中的第一,第二,第四和第五列对这些进行分组,并将第三列相加.对于此示例,我将列命名为col1,col2,col3,col4,col5.
在SQL中我会做这样的事情:
select col1, col2, sum(col3), col4, col5 from my table
group by col1, col2, col4, col5
Run Code Online (Sandbox Code Playgroud)
有没有"酷"的方式来做这个或者它是一个手动循环?
Dav*_*ver 13
你想要的itertools.groupby.
请注意,groupby需要对输入进行排序,因此您可能需要事先做到:
keyfunc = lambda t: (t[0], t[1], t[3], t[4])
data.sort(key=keyfunc)
for key, rows in itertools.groupby(data, keyfunc):
print key, sum(r[2] for r in rows)
Run Code Online (Sandbox Code Playgroud)
>>> [(x[0:2] + (sum(z[2] for z in y),) + x[2:5]) for (x, y) in
itertools.groupby(sorted(L, key=operator.itemgetter(0, 1, 3, 4)),
key=operator.itemgetter(0, 1, 3, 4))]
[
('A', '', Decimal('21.0000000000'), 1330, datetime.datetime(2012, 5, 14, 0, 0)),
('A', '', Decimal('4.0000000000'), 1330, datetime.datetime(2012, 6, 8, 0, 0)),
('AA', 'C', Decimal('31.0000000000'), 1330, datetime.datetime(2012, 5, 31, 0, 0)),
('B', '', Decimal('7.0000000000'), 1330, datetime.datetime(2012, 5, 24, 0, 0)),
('B', '', Decimal('31.0000000000'), 1330, datetime.datetime(2012, 6, 4, 0, 0))
]
Run Code Online (Sandbox Code Playgroud)
(注意:输出重新格式化)
| 归档时间: |
|
| 查看次数: |
9812 次 |
| 最近记录: |