Lua:在给定符号列表的情况下迭代每个可能的k长度字符串

Fáb*_*rez 5 string lua permutation bioinformatics

我想在给定符号列表的情况下迭代每个可能的k长度字符串(称为k-mer).例如,如果k = 3symbols = {A, C, G, T},那么:

AAA
AAC
AAG
...
TTG
TTT
Run Code Online (Sandbox Code Playgroud)

这是我生成字符串的代码:

local k = 3
local bases = {'A', 'C', 'T', 'G'}

-- Generate the string (AAA...AAA)
local kmer_gen = {}
for i = 1,k do kmer_gen[i] = "A" end
local kmer = table.concat(kmer_gen)
Run Code Online (Sandbox Code Playgroud)

它有效,但肯定不好看.这可以更优雅地实现吗?

现在,我不知道如何迭代可能的k-mers.一种解决方案是保持替换每个字符,但这看不到有效.另一种方法是从二进制解码(每2位代表一个基数),但实现混乱并需要按位操作.还有其他想法吗?

lhf*_*lhf 6

这是一个使用迭代器的解决方案.这是协同程序的一个很好的例子,这是一种值得在Lua中了解的技术.另见http://www.lua.org/pil/9.3.html.

local bases = {'A', 'C', 'T', 'G'}

local function allstrings(n,t,k,s)
    k=k or 1
    s=s or {}
    if k>n then
        coroutine.yield(table.concat(s))
    else
        for i=1,#t do
            s[k]=t[i]
            allstrings(n,t,k+1,s)
        end
    end
end

local function kmer(n,t)
    return coroutine.wrap(allstrings),n,t
end

for w in kmer(3,bases) do
    print(w)
end
Run Code Online (Sandbox Code Playgroud)