我正在开发一个python项目,它读取一个URL编码的重叠字符串列表.每个字符串长度为15个字符,并且与其顺序字符串重叠至少3个字符,最多15个字符(相同).
该程序的目标是从重叠字符串列表(有序或无序)到压缩的URL编码字符串.
我当前的方法在重叠字符串中的重复段处失败.例如,我的程序错误地组合:
StrList1 = [ 'd+%7B%0A++++public+', 'public+static+v','program%0Apublic+', 'ublic+class+Hel', 'lass+HelloWorld', 'elloWorld+%7B%0A+++', '%2F%2F+Sample+progr', 'program%0Apublic+']
Run Code Online (Sandbox Code Playgroud)
输出:
output = ['ublic+class+HelloWorld+%7B%0A++++public+', '%2F%2F+Sample+program%0Apublic+static+v`]
Run Code Online (Sandbox Code Playgroud)
当正确的输出是:
output = ['%2F%2F+Sample+program%0Apublic+class+HelloWorld+%7B%0A++++public+static+v']
Run Code Online (Sandbox Code Playgroud)
我使用简单的python,而不是biopython或序列对齐器,虽然也许我应该?
非常感谢有关此事的任何建议或在python中做到这一点的好方法的建议!
谢谢!