查找数字子集的分组

Ian*_*des 3 python intersection set

假设我有这些数字集

a = {1, 2, 3}
b = {2, 3, 4}
c = {1, 5}
Run Code Online (Sandbox Code Playgroud)

我想找到集合的所有不同的数字分组.结果将是

{1}, {2, 3}, {4}, {5}
Run Code Online (Sandbox Code Playgroud)

我的天真方法,不起作用,是这样的:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
for i in range(1, 5):
    s = set.intersection(*[x for x in data if i in x])
    print(s)
Run Code Online (Sandbox Code Playgroud)

哪个回报

set([1])
set([2, 3])
set([2, 3])
set([2, 3, 4])
Run Code Online (Sandbox Code Playgroud)

哪个可以很容易地重复删除,但不会给出预期的结果.

如何只获取集合子集中存在的数字分组?

MSe*_*ert 5

您的代码有两个问题:

  • 你停下来5,但range不包括停止,所以你不检查5.
  • 如果值仅在一个集合中,则需要创建仅包含该值的集合.至少你的预期结果看起来好像是所期望的行为.

因此,通过修复这些问题,代码将如下所示:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
for i in range(1, 6):
    useful_sets = [x for x in data if i in x]
    if len(useful_sets) <= 1:
        print(set([i]))
    else:
        s = set.intersection(*useful_sets)
        print(s)

# prints:
# {1}
# {2, 3}
# {2, 3}
# {4}
# {5}
Run Code Online (Sandbox Code Playgroud)

要获得完整(而非重复)的结果,您可以将它们存储为集合中的frozensets:

data = [{1, 2, 3}, {2, 3, 4}, {1, 5}]
res = set()
for i in range(1, 6):
    useful_sets = [x for x in data if i in x]
    if len(useful_sets) <= 1:
        res.add(frozenset([i]))
    else:
        s = set.intersection(*useful_sets)
        res.add(frozenset(s))

print(res)
# {frozenset({5}), frozenset({4}), frozenset({2, 3}), frozenset({1})}
Run Code Online (Sandbox Code Playgroud)

哪个(订购除外)应该是您想要的.