Ben*_*lin 4 python list python-3.x
我有一个元组列表,每个元组包含三个值。我想将它们“卷起来”或将它们分组,以便对于前两个值相同的所有元组,它将返回一个列表列表,其中每个组件列表包含:1:第一个值,2:第二个值,3 :与前两个匹配的所有第三个值的列表。
因为我在这里编写整个脚本,所以我在数据类型上有一些灵活性,所以如果我以完全错误的方式接近它,请告诉我。我确实想知道是否有更简单的方法来使用 Pandas 来完成它。
我想知道是否可以使用itertools.groupby()它来实现这一点。我认为它可能需要与operator.itemgetter()访问各种元组的正确部分结合使用。
import itertools
import operator
list = [(1, 1, 4), (1, 1, 9), (1, 1, 14), (2, 1, 12), (2, 1, 99), (2, 6, 14), (2, 6, 19)]
list=sorted(list)
def sorter(list):
grouper = itertools.groupby(list, operator.itemgetter(0))
for key, subiter in grouper:
l = []
grouper2 = itertools.groupby(subiter, operator.itemgetter(0))
for key, subiter in grouper2:
l.append(subiter)
yield key, l
Run Code Online (Sandbox Code Playgroud)
这段代码代表了我正在考虑的总体方向,但它不会产生所需的输出。所需的输出将是:
[[1, 1, [4, 9, 14]], [2, 1, [12, 99]], [2, 6, [14, 19]]]
Run Code Online (Sandbox Code Playgroud)
同样,我在这里的数据类型方面有很大的灵活性,所以如果我接近这个错误,我愿意尝试完全不同的东西。
无需使用groupby单个字段的两个嵌套分组。而是使用itemgetter两个参数或 alambda一次按前两个值分组,然后使用列表理解来获取最终元素。
>>> from itertools import groupby
>>> from operator import itemgetter
>>> lst = [(1, 1, 4), (1, 1, 9), (1, 1, 14), (2, 1, 12), (2, 1, 99), (2, 6, 14), (2, 6, 19)]
>>> [(*k, [x[2] for x in g]) for k, g in groupby(lst, key=itemgetter(0, 1))]
[(1, 1, [4, 9, 14]), (2, 1, [12, 99]), (2, 6, [14, 19])]
Run Code Online (Sandbox Code Playgroud)
如果,无论出于何种原因,您想使用两个单独的groupby,您可以使用:
>>> [(k1, k2, [x[2] for x in g2]) for k1, g1 in groupby(lst, key=itemgetter(0))
... for k2, g2 in groupby(g1, key=itemgetter(1))]
[(1, 1, [4, 9, 14]), (2, 1, [12, 99]), (2, 6, [14, 19])]
Run Code Online (Sandbox Code Playgroud)
当然,这也可以用作常规(嵌套)循环,更符合您的原始代码:
def sorter(lst):
for k1, g1 in groupby(lst, key=itemgetter(0)):
for k2, g2 in groupby(g1, key=itemgetter(1)):
yield (k1, k2, [x[2] for x in g2])
Run Code Online (Sandbox Code Playgroud)
或者使用 single groupby,返回一个生成器对象:
def sorter(lst):
return ((*k, [x[2] for x in g]) for k, g in groupby(lst, key=itemgetter(0, 1)))
Run Code Online (Sandbox Code Playgroud)
与往常一样,这假设lst已经sorted由相同的key. 如果不是,请先排序。
| 归档时间: |
|
| 查看次数: |
121 次 |
| 最近记录: |