Python:列表中最长公共子序列的长度

Mil*_*ano 5 python list longest-substring

python中是否有内置函数返回两个列表中最长公共子序列的长度?

a=[1,2,6,5,4,8]
b=[2,1,6,5,4,4]

print a.llcs(b)

>>> 3
Run Code Online (Sandbox Code Playgroud)

我试图找到最长的常见子序列,然后得到它的长度,但我认为必须有一个更好的解决方案.

Mar*_*ers 8

您可以轻松地将LCS重组为LLCS:

def lcs_length(a, b):
    table = [[0] * (len(b) + 1) for _ in xrange(len(a) + 1)]
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            table[i][j] = (
                table[i - 1][j - 1] + 1 if ca == cb else
                max(table[i][j - 1], table[i - 1][j]))
    return table[-1][-1]
Run Code Online (Sandbox Code Playgroud)

演示:

>>> a=[1,2,6,5,4,8]
>>> b=[2,1,6,5,4,4]
>>> lcs_length(a, b)
4
Run Code Online (Sandbox Code Playgroud)

如果您想要最长的公共子字符串(一个不同但相关的问题,序列是连续的),请使用:

def lcsubstring_length(a, b):
    table = [[0] * (len(b) + 1) for _ in xrange(len(a) + 1)]
    l = 0
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            if ca == cb:
                table[i][j] = table[i - 1][j - 1] + 1
                if table[i][j] > l:
                    l = table[i][j]
    return l
Run Code Online (Sandbox Code Playgroud)

这与lcs_length动态编程方法非常相似,但我们跟踪到目前为止找到的最大长度(因为不再保证表中的最后一个元素是最大值).

返回3:

>>> lcsubstring_length(a, b)
3
Run Code Online (Sandbox Code Playgroud)

一个稀疏表变体,不必跟踪所有0s:

def lcsubstring_length(a, b):
    table = {}
    l = 0
    for i, ca in enumerate(a, 1):
        for j, cb in enumerate(b, 1):
            if ca == cb:
                table[i, j] = table.get((i - 1, j - 1), 0) + 1
                if table[i, j] > l:
                    l = table[i, j]
    return l
Run Code Online (Sandbox Code Playgroud)