设置与自定义比较器的交集?

pmd*_*aly 5 python

我有几组字符串

set_a = {'abcd', 'efgh', 'ghij'}
set_b = {'abce', 'efgk', 'ghij'}
Run Code Online (Sandbox Code Playgroud)

我想找到这两个集合之间的交集,但元素相等性定义如下

def match(string_a, string_b, threshold=0.8):
    lcs_len = lcs(string_a, item_set_b)
    return (lcs_len / max(len(string_a), len(item_set_b))) > 0.8
Run Code Online (Sandbox Code Playgroud)

基本上,如果 lcs 至少是字符串长度的 80%,我们认为这种匹配“足够了”。我知道将自定义比较器传递给排序方法的工作原理是这样的,但我没有在集合操作中找到任何用于自定义比较器的东西。

Cor*_*mer 4

您可以迭代两个集合的笛卡尔积,然后保留两个集合中的元素并满足您的谓词

from itertools import product
{i for i,j in product(set_a, set_b) if i in set_b and match(i,j)}
Run Code Online (Sandbox Code Playgroud)