Python:dict列表,如果存在则递增一个dict值,如果没有附加一个新的dict

Nat*_*tim 94 python loops tuples list

我想做那样的事情.

list_of_urls = ['http://www.google.fr/', 'http://www.google.fr/', 
                'http://www.google.cn/', 'http://www.google.com/', 
                'http://www.google.fr/', 'http://www.google.fr/', 
                'http://www.google.fr/', 'http://www.google.com/', 
                'http://www.google.fr/', 'http://www.google.com/', 
                'http://www.google.cn/']

urls = [{'url': 'http://www.google.fr/', 'nbr': 1}]

for url in list_of_urls:
    if url in [f['url'] for f in urls]:
         urls[??]['nbr'] += 1
    else:
         urls.append({'url': url, 'nbr': 1})
Run Code Online (Sandbox Code Playgroud)

我能怎么做 ?我不知道我是否应该使用元组编辑它或找出元组索引?

有帮助吗?

ste*_*eha 184

这是组织事物的一种非常奇怪的方式.如果您存储在字典中,这很容易:

# This example should work in any version of Python.
# urls_d will contain URL keys, with counts as values, like: {'http://www.google.fr/' : 1 }
urls_d = {}
for url in list_of_urls:
    if not url in urls_d:
        urls_d[url] = 1
    else:
        urls_d[url] += 1
Run Code Online (Sandbox Code Playgroud)

这个用于更新计数字典的代码是Python中常见的"模式".很常见的是,有一个特殊的数据结构,defaultdict只是为了使这更容易:

from collections import defaultdict  # available in Python 2.5 and newer

urls_d = defaultdict(int)
for url in list_of_urls:
    urls_d[url] += 1
Run Code Online (Sandbox Code Playgroud)

如果您defaultdict使用密钥访问,并且该密钥尚未存在defaultdict,则会自动添加密钥以使用默认值.将defaultdict带您传入的调用,并调用它来获得默认值.在这种情况下,我们通过了课程int; 当Python调用int()它时返回一个零值.因此,第一次引用URL时,其计数初始化为零,然后在计数中添加一个.

但是一个充满计数的字典也是一种常见的模式,因此Python提供了一个现成的类:containers.Counter 你只需Counter通过调用类来创建一个实例,传入任何可迭代的类; 它构建了一个字典,其中键是来自iterable的值,值是关键字在迭代中出现的次数的计数.上面的例子然后变成:

from collections import Counter  # available in Python 2.7 and newer

urls_d = Counter(list_of_urls)
Run Code Online (Sandbox Code Playgroud)

如果你真的需要按照你展示的方式去做,最简单快捷的方法是使用这三个例子中的任何一个,然后构建你需要的那个.

from collections import defaultdict  # available in Python 2.5 and newer

urls_d = defaultdict(int)
for url in list_of_urls:
    urls_d[url] += 1

urls = [{"url": key, "nbr": value} for key, value in urls_d.items()]
Run Code Online (Sandbox Code Playgroud)

如果您使用的是Python 2.7或更高版本,则可以在单行中执行:

from collections import Counter

urls = [{"url": key, "nbr": value} for key, value in Counter(list_of_urls).items()]
Run Code Online (Sandbox Code Playgroud)

  • 你仍然可以{%for url,nbr in urls.items%} {{url}}:{{nbr}} {%endfor%} (3认同)

mik*_*pie 133

使用默认工作,但也是如此:

urls[url] = urls.get(url, 0) + 1
Run Code Online (Sandbox Code Playgroud)

使用.get,如果不存在,您可以获得默认返回.默认情况下它是None,但在我发送给你的情况下,它将为0.

  • 实际上我认为这是最好的答案,因为它在给定的字典上是不可知的,这是一个巨大的奖励imo. (9认同)
  • 这应该是答案。高效,干净,切中要害!!我希望 stackoverflow 允许社区与问题海报一起决定答案。 (2认同)
  • 比 defaultdict() 慢得多。 (2认同)

Gre*_*ill 22

使用defaultdict:

from collections import defaultdict

urls = defaultdict(int)

for url in list_of_urls:
    urls[url] += 1
Run Code Online (Sandbox Code Playgroud)


mos*_*lix 13

这对我来说总是很好:

for url in list_of_urls:
    urls.setdefault(url, 0)
    urls[url] += 1
Run Code Online (Sandbox Code Playgroud)


小智 5

除了第一次之外,每次看到一个单词时,if 语句的测试都会失败。如果您计算大量单词,许多单词可能会出现多次。在值的初始化仅发生一次并且该值的增加将发生多次的情况下,使用 try 语句会更便宜:

urls_d = {}
for url in list_of_urls:
    try:
        urls_d[url] += 1
    except KeyError:
        urls_d[url] = 1
Run Code Online (Sandbox Code Playgroud)

您可以阅读更多相关内容: https ://wiki.python.org/moin/PythonSpeed/PerformanceTips