Python:同时使用多个键值对进行字典理解

kup*_*gov 5 python list-comprehension python-3.x dictionary-comprehension

目标:表达的工作模拟

{k1: v1, k2: v2 for k1, k2, v1, v2 in data}
Run Code Online (Sandbox Code Playgroud)

或更具体的情况{k1: v, k2: v for k1, k2, v, _ in data}

data仅迭代1 次(在给定的示例中data是 4 元组的可迭代对象)。

(以及关于列表理解的类似问题,例如[myfunc1(v1), myfunc2(v2) for v1, v2 in data])。

我只能假设使用自己的迭代器的解决方案:

def getby(iterable_data, iterable_indexes):
    for indexed_data in iterable_data:
        for tupl in iterable_indexes:
            yield tuple(indexed_data[ind] for ind in tupl)
    raise StopIteration
Run Code Online (Sandbox Code Playgroud)

工作示例:list(getby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')], [(0, 1), (2, 1)]))return [('a', 'b'), ('c', 'b'), ('d', 'e'), ('f', 'e')]。但可能会很慢。

我还可以假设上面的示例中itertools.chain和的等效表达式itertools.groupby

list(chain.from_iterable(lst for lst, _ in groupby([('a', 'b', 'c'), ('d', 'e', 'f', 'g')],
                                                   lambda lst: [(lst[0], lst[1]), (lst[2], lst[1])])))
Run Code Online (Sandbox Code Playgroud)

但有可能它很丑。

基于ipython的两个解决方案的比较:第一个1000个循环,最好的3:每个循环20.2毫秒,第二个1000个循环,最好的3:每个循环4.12毫秒,所以第二个解决方案确实更快。但也许存在更优雅的解决方案?

Mar*_*ers 5

理解格式严格限制为每次迭代一个结果。不过,您可以添加额外的循环,以循环遍历要插入的多个元素:

{k: v for k1, k2, v1, v2 in data for k, v in ((k1, v1), (k2, v2))}
Run Code Online (Sandbox Code Playgroud)

或你的第二个例子:

{k: v for k1, k2, v, _ in data for k in (k1, k2)}
Run Code Online (Sandbox Code Playgroud)

这相当于:

result = {}
for k1, k2, v1, v2 in data:
    for k in (k1, k2):
        result[k] = v
Run Code Online (Sandbox Code Playgroud)

如果您可以将某些内容写为嵌套循环,可能if在中间有语句,并且最内层只有一个语句分配键值对,那么您可以用字典理解来表达它。

您也可以使用 执行此操作chain.from_iterable(),但随后生成具有键值对序列的列表或元组,并将结果传递给函数dict()

dict(chain.from_iterable(((k1, v1), (k2, v2)) for k1, v1, k2, v2 in data))
dict(chain.from_iterable(((k1, v), (k2, v)) for k1, k2, v, _ in data))
Run Code Online (Sandbox Code Playgroud)