Python中的反向字典查找

Rad*_*Hex 86 python dictionary

通过了解字典中的值,有没有直接找到密钥的方法?

我能想到的就是:

key = [key for key, value in dict_obj.items() if value == 'value'][0]
Run Code Online (Sandbox Code Playgroud)

Pau*_*McG 82

你的列表理解通过查找所有匹配的所有dict的项目,然后只返回第一个键.此生成器表达式仅在必要时迭代以返回第一个值:

key = next(key for key, value in dd.items() if value == 'value')
Run Code Online (Sandbox Code Playgroud)

dd字典在哪里.StopIteration如果没有找到匹配则会引发,所以你可能想要捕获它并返回一个更合适的异常,如ValueErrorKeyError.

  • 还有`keys = {key for key,value in dd.items()if value =='value'}`获取所有键的集合,如果有几个匹配. (7认同)
  • @askewchan - 没有真正需要将它作为一个集合返回,dict键必须是唯一的,只需返回一个列表 - 或者更好,返回一个生成器表达式,让调用者把它放在他们想要的任何容器中. (6认同)
  • 是的,当 key 不在列表中时,它可能会引发与 listObject.index(key) 相同的异常。 (2认同)

Joh*_*ooy 51

在某些情况下,字典是一个映射

例如,

d = {1: "one", 2: "two" ...}
Run Code Online (Sandbox Code Playgroud)

如果您只进行一次查找,那么您的方法就可以了.但是,如果您需要执行多个查找,则创建反向字典会更有效

ivd = {v: k for k, v in d.items()}
Run Code Online (Sandbox Code Playgroud)

如果有多个键具有相同值的可能性,则需要在这种情况下指定所需的行为.

如果你的Python是2.6或更早,你可以使用

ivd = dict((v, k) for k, v in d.items())
Run Code Online (Sandbox Code Playgroud)

  • 很好的优化.但是,我认为您打算使用dict()将2元组列表转换为字典:`ivd = dict([(v,k)for(k,v)in d.items()]) (6认同)
  • @hobs只使用字典理解而不是列表理解:`invd = {v:k代表k,v代表d.items()}` (2认同)

hob*_*obs 32

这个版本比你的版本短26%,但功能相同,即使是冗余/模糊值(返回第一个匹配,就像你的那样).但是,它可能比你的慢两倍,因为它会从dict创建一个列表两次.

key = dict_obj.keys()[dict_obj.values().index(value)]
Run Code Online (Sandbox Code Playgroud)

或者,如果您希望简洁而不是可读性,则可以再保存一个字符

key = list(dict_obj)[dict_obj.values().index(value)]
Run Code Online (Sandbox Code Playgroud)

如果您更喜欢效率,@ PaulMcGuire的方法会更好.如果有许多共享相同值的键,则更有效的是不使用列表推导来实例化该键列表,而是使用生成器:

key = (key for key, value in dict_obj.items() if value == 'value').next()
Run Code Online (Sandbox Code Playgroud)

  • 假设是原子操作,键和值是否保证处于相同的对应顺序? (2认同)

Ign*_*ams 11

空无一人.不要忘记,可以在任意数量的键上找到该值,包括0或大于1.

  • **我厌恶这样的非答案.**"不要试图做你有理由想做的事!" 是_not_一个可接受的答案.为什么接受这个?对于这个问题的高评价答案证明,反向字典查找可以在少于80个字符的纯Python中轻松实现.它没有比那更"直截了当"了.[Paul McGuire](/sf/users/11565151/)的[解决方案](/sf/answers/179835351/)可能效率最高,但他们_all_工作.`</叹息>` (101认同)
  • .index只需要保证它返回一个单独的值,并且它不需要首先词法上只是它是第一个匹配并且它的行为是稳定的(随着时间的推移在同一个dict上多次调用应该产生相同的匹配元素).除非字典随着时间的推移重新排列未经修改的哈希值,因为其他元素被添加,删除或修改,它仍然可以正常工作.一个天真的实现:dictObject.items().index(key) (3认同)
  • python有一个.index方法列出返回第一个找到的具有指定值的索引或一个异常(如果没有找到)...为什么这样的语义不能应用于字典? (2认同)

Fre*_*eek 6

由于这仍然是非常相关的,第一次谷歌打击,我只是花了一些时间搞清楚,我将发布我的(使用Python 3)解决方案:

testdict = {'one'   : '1',
            'two'   : '2',
            'three' : '3',
            'four'  : '4'
            }

value = '2'

[key for key in testdict.items() if key[1] == value][0][0]

Out[1]: 'two'
Run Code Online (Sandbox Code Playgroud)

它会为您提供匹配的第一个值.


eus*_*iro 6

制作一个反向字典

reverse_dictionary = {v:k for k,v in dictionary.items()} 
Run Code Online (Sandbox Code Playgroud)

如果您有很多反向查找要做

  • 仅当键和值之间存在 1:1 映射时,此功能才有效。 (4认同)

Noc*_*wer 5

也许像DoubleDict下面这样的字典类是你想要的?您可以使用任何一个提供的元类,DoubleDict也可以完全避免使用任何元类.

import functools
import threading

################################################################################

class _DDChecker(type):

    def __new__(cls, name, bases, classdict):
        for key, value in classdict.items():
            if key not in {'__new__', '__slots__', '_DoubleDict__dict_view'}:
                classdict[key] = cls._wrap(value)
        return super().__new__(cls, name, bases, classdict)

    @staticmethod
    def _wrap(function):
        @functools.wraps(function)
        def check(self, *args, **kwargs):
            value = function(self, *args, **kwargs)
            if self._DoubleDict__forward != \
               dict(map(reversed, self._DoubleDict__reverse.items())):
                raise RuntimeError('Forward & Reverse are not equivalent!')
            return value
        return check

################################################################################

class _DDAtomic(_DDChecker):

    def __new__(cls, name, bases, classdict):
        if not bases:
            classdict['__slots__'] += ('_DDAtomic__mutex',)
            classdict['__new__'] = cls._atomic_new
        return super().__new__(cls, name, bases, classdict)

    @staticmethod
    def _atomic_new(cls, iterable=(), **pairs):
        instance = object.__new__(cls, iterable, **pairs)
        instance.__mutex = threading.RLock()
        instance.clear()
        return instance

    @staticmethod
    def _wrap(function):
        @functools.wraps(function)
        def atomic(self, *args, **kwargs):
            with self.__mutex:
                return function(self, *args, **kwargs)
        return atomic

################################################################################

class _DDAtomicChecker(_DDAtomic):

    @staticmethod
    def _wrap(function):
        return _DDAtomic._wrap(_DDChecker._wrap(function))

################################################################################

class DoubleDict(metaclass=_DDAtomicChecker):

    __slots__ = '__forward', '__reverse'

    def __new__(cls, iterable=(), **pairs):
        instance = super().__new__(cls, iterable, **pairs)
        instance.clear()
        return instance

    def __init__(self, iterable=(), **pairs):
        self.update(iterable, **pairs)

    ########################################################################

    def __repr__(self):
        return repr(self.__forward)

    def __lt__(self, other):
        return self.__forward < other

    def __le__(self, other):
        return self.__forward <= other

    def __eq__(self, other):
        return self.__forward == other

    def __ne__(self, other):
        return self.__forward != other

    def __gt__(self, other):
        return self.__forward > other

    def __ge__(self, other):
        return self.__forward >= other

    def __len__(self):
        return len(self.__forward)

    def __getitem__(self, key):
        if key in self:
            return self.__forward[key]
        return self.__missing_key(key)

    def __setitem__(self, key, value):
        if self.in_values(value):
            del self[self.get_key(value)]
        self.__set_key_value(key, value)
        return value

    def __delitem__(self, key):
        self.pop(key)

    def __iter__(self):
        return iter(self.__forward)

    def __contains__(self, key):
        return key in self.__forward

    ########################################################################

    def clear(self):
        self.__forward = {}
        self.__reverse = {}

    def copy(self):
        return self.__class__(self.items())

    def del_value(self, value):
        self.pop_key(value)

    def get(self, key, default=None):
        return self[key] if key in self else default

    def get_key(self, value):
        if self.in_values(value):
            return self.__reverse[value]
        return self.__missing_value(value)

    def get_key_default(self, value, default=None):
        return self.get_key(value) if self.in_values(value) else default

    def in_values(self, value):
        return value in self.__reverse

    def items(self):
        return self.__dict_view('items', ((key, self[key]) for key in self))

    def iter_values(self):
        return iter(self.__reverse)

    def keys(self):
        return self.__dict_view('keys', self.__forward)

    def pop(self, key, *default):
        if len(default) > 1:
            raise TypeError('too many arguments')
        if key in self:
            value = self[key]
            self.__del_key_value(key, value)
            return value
        if default:
            return default[0]
        raise KeyError(key)

    def pop_key(self, value, *default):
        if len(default) > 1:
            raise TypeError('too many arguments')
        if self.in_values(value):
            key = self.get_key(value)
            self.__del_key_value(key, value)
            return key
        if default:
            return default[0]
        raise KeyError(value)

    def popitem(self):
        try:
            key = next(iter(self))
        except StopIteration:
            raise KeyError('popitem(): dictionary is empty')
        return key, self.pop(key)

    def set_key(self, value, key):
        if key in self:
            self.del_value(self[key])
        self.__set_key_value(key, value)
        return key

    def setdefault(self, key, default=None):
        if key not in self:
            self[key] = default
        return self[key]

    def setdefault_key(self, value, default=None):
        if not self.in_values(value):
            self.set_key(value, default)
        return self.get_key(value)

    def update(self, iterable=(), **pairs):
        for key, value in (((key, iterable[key]) for key in iterable.keys())
                           if hasattr(iterable, 'keys') else iterable):
            self[key] = value
        for key, value in pairs.items():
            self[key] = value

    def values(self):
        return self.__dict_view('values', self.__reverse)

    ########################################################################

    def __missing_key(self, key):
        if hasattr(self.__class__, '__missing__'):
            return self.__missing__(key)
        if not hasattr(self, 'default_factory') \
           or self.default_factory is None:
            raise KeyError(key)
        return self.__setitem__(key, self.default_factory())

    def __missing_value(self, value):
        if hasattr(self.__class__, '__missing_value__'):
            return self.__missing_value__(value)
        if not hasattr(self, 'default_key_factory') \
           or self.default_key_factory is None:
            raise KeyError(value)
        return self.set_key(value, self.default_key_factory())

    def __set_key_value(self, key, value):
        self.__forward[key] = value
        self.__reverse[value] = key

    def __del_key_value(self, key, value):
        del self.__forward[key]
        del self.__reverse[value]

    ########################################################################

    class __dict_view(frozenset):

        __slots__ = '__name'

        def __new__(cls, name, iterable=()):
            instance = super().__new__(cls, iterable)
            instance.__name = name
            return instance

        def __repr__(self):
            return 'dict_{}({})'.format(self.__name, list(self))
Run Code Online (Sandbox Code Playgroud)


Sal*_*ali 5

不,如果不查看所有键并检查它们的所有值,您就无法有效地完成此操作。所以你需要O(n)时间来做到这一点。如果您需要进行大量此类查找,则需要通过构造一个反向字典(也可以在 中完成O(n))然后在该反向字典中进行搜索(每次搜索平均需要O(1))来有效地完成此操作。

下面是如何从普通字典构造反向字典(它将能够进行一对多映射)的示例:

for i in h_normal:
    for j in h_normal[i]:
        if j not in h_reversed:
            h_reversed[j] = set([i])
        else:
            h_reversed[j].add(i)
Run Code Online (Sandbox Code Playgroud)

例如,如果您的

h_normal = {
  1: set([3]), 
  2: set([5, 7]), 
  3: set([]), 
  4: set([7]), 
  5: set([1, 4]), 
  6: set([1, 7]), 
  7: set([1]), 
  8: set([2, 5, 6])
}
Run Code Online (Sandbox Code Playgroud)

你的h_reversed意愿

{
  1: set([5, 6, 7]),
  2: set([8]), 
  3: set([1]), 
  4: set([5]), 
  5: set([8, 2]), 
  6: set([8]), 
  7: set([2, 4, 6])
}
Run Code Online (Sandbox Code Playgroud)


Not*_*chy 5

# oneline solution using zip
>> x = {'a':100, 'b':999}
>> y = dict(zip(x.values(), x.keys()))  
>> y
{100: 'a', 999: 'b'}
Run Code Online (Sandbox Code Playgroud)