从Python字典对象中提取键值对的子集?

Jay*_*esh 278 python dictionary associative-array

我有一个大的字典对象,有几个键值对(大约16),但我只对它们中的3个感兴趣.实现这一目标的最佳方式(最短/最有效/最优雅)是什么?

我所知道的最好的是:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}
Run Code Online (Sandbox Code Playgroud)

我相信有比这更优雅的方式.想法?

Mar*_*air 381

你可以尝试:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))
Run Code Online (Sandbox Code Playgroud)

......或者 Python 3Python版本2.7或更高版本(感谢FábioDiniz指出它也适用于2.7):

{k: bigdict[k] for k in ('l', 'm', 'n')}
Run Code Online (Sandbox Code Playgroud)

更新:正如HåvardS指出的那样,我假设您知道密钥将出现在字典中 - 如果您无法做出这样的假设,请参阅他的回答.或者,正如timbo在评论中指出的那样,如果你想要一个缺少的bigdict键映射到None,你可以这样做:

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}
Run Code Online (Sandbox Code Playgroud)

如果你正在使用Python 3,并且你想要新的dict中想要的键实际存在于原始dict中,你可以使用视图对象实现一些set操作的事实:

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}
Run Code Online (Sandbox Code Playgroud)

  • `(k:bigdict.get(k,None)for k in('l','m','n')}`将通过设置键中的键来处理源字典中缺少指定键的情况.没有新的词典 (8认同)
  • @MarkLongair取决于用例{k:bigdict [k]用于k in('l','m','n')如果bigdict中的k可能更好,因为它只存储实际具有值的键. (8认同)
  • 如果我的“dict”太大怎么办? (7认同)
  • 从某种程度上来说,从我的背景中可以清楚地知道,这些关键字在字典中...... (5认同)
  • 如果`bigdict`不包含`k`,则会失败 (4认同)
  • 对于Python2.7,`bigdict.keys()&{'l','m','n'}`==>`bigdict.viewkeys()&{'l','m','n'}` (4认同)

Håv*_*d S 109

有点短,至少:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)
Run Code Online (Sandbox Code Playgroud)

  • 如果不是bigdict而不是将键设置为None,则排除键的替代行为为+1. (5认同)
  • 这个答案由“t”保存。 (4认同)
  • 另外,解决方案的一个较短的变体(语法)是使用“{}”,即“{k: bigdict[k] for k in Want_keys if k in bigdict}” (2认同)

the*_*oom 21

interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}
Run Code Online (Sandbox Code Playgroud)


Skl*_*vit 14

所有提到的方法的速度比较:

Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop
Run Code Online (Sandbox Code Playgroud)

正如预期的那样:字典理解是最好的选择.

  • 好的。也许值得从[接受的解决方案](/sf/answers/374684131/)添加`{key:bigdict[key] for key in bigdict.keys() & keys}`,它实际上完成了过滤器(在我的机器上)比您列出的第一个不过滤的方法更快。事实上,对于这些非常大的键集,`{key:bigdict[key] for key in set(keys) & set(bigdict.keys())}`似乎更快...... (2认同)

Meo*_*eow 11

此答案使用类似于所选答案的字典理解,但除了缺少的项目之外不会.

python 2版本:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}
Run Code Online (Sandbox Code Playgroud)

python 3版本:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}
Run Code Online (Sandbox Code Playgroud)

  • ...但是如果大字典是巨大的,它仍将完全迭代(这是一个O(n)操作),而逆将只抓取3个项目(每个都是O(1)操作). (2认同)

小智 9

如果您想保留大部分键并删除一些键,则可以采用另一种方法:

{k: bigdict[k] for k in bigdict.keys() if k not in ['l', 'm', 'n']}
Run Code Online (Sandbox Code Playgroud)

  • 更短:`{k: v for k, v in bigdict.items() if k not in ['l', 'm', 'n']}` (4认同)

phi*_*mue 7

也许:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])
Run Code Online (Sandbox Code Playgroud)

Python 3 甚至支持以下内容:

subdict={a:bigdict[a] for a in ['l','m','n']}
Run Code Online (Sandbox Code Playgroud)

请注意,您可以按如下方式检查字典中是否存在:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])
Run Code Online (Sandbox Code Playgroud)

分别 对于蟒蛇 3

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}
Run Code Online (Sandbox Code Playgroud)


hal*_*ump 6

您还可以使用map(无论如何这是一个非常有用的功能):

sd = dict(map(lambda k: (k, l.get(k, None)), l))

例子:

large_dictionary = {'a1':123, 'a2':45, 'a3':344}
list_of_keys = ['a1', 'a3']
small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))
Run Code Online (Sandbox Code Playgroud)

PS:我.get(key, None)从以前的答案中借用了:)