小编hol*_*ser的帖子

来自gff3文件的scikit-bio extract基因组特征

scikit-bio是否有可能从基因组fasta文件中提取存储在gff3格式文件中的基因组特征?

例:


genome.fasta

>sequence1
ATGGAGAGAGAGAGAGAGAGGGGGCAGCATACGCATCGACATACGACATACATCAGATACGACATACTACTACTATGA
Run Code Online (Sandbox Code Playgroud)

annotation.gff3

#gff-version 3
sequence1   source  gene    1   78  .   +   .   ID=gene1
sequence1   source  mRNA    1   78  .   +   .   ID=transcript1;parent=gene1
sequence1   source  CDS 1   6   .   +   0   ID=CDS1;parent=transcript1
sequence1   source  CDS 73  78  .   +   0   ID=CDS2;parent=transcript1
Run Code Online (Sandbox Code Playgroud)

mRNA特征(转录物1)的所需序列将是两个子CDS特征的连接.所以在这种情况下,这将是'ATGGAGCTATGA'.

python bioinformatics python-3.x skbio

7
推荐指数
1
解决办法
204
查看次数

标签 统计

bioinformatics ×1

python ×1

python-3.x ×1

skbio ×1