我正在计算来自多个序列比对的单倍型,并且正在获得一系列重复序列,例如RNNNNNNNT和RNNNT.有许多变化,使得很难理解数据.
数据如下所示,我是否有兴趣基于haplotypes_1生成列haplotypes_2,如下所示:
hap_code haplotypes_1 haplotypes_2
1 SKNNNRNNNNNKNNNNNNNKF SK(N3)R(N5)K(N7)KF
2 SKNNNNNNNNNKNNNNNNNNKF SK(N9)K(N8)KF
3 SKNNNNNNNNNNNNNNNNKF SK(N16)KF
Run Code Online (Sandbox Code Playgroud)