小编Nim*_*lan的帖子

如何在一行中计算匹配的模式?

enter code here我有一个包含序列的 fasta 文件

>lcl|QCYY01003067.1_cds_ROT65593.1_2 
ATGCGTCTCCCCTTTAGAGAGTTCTCTCTAGCTACGTA
>lcl|QCYY01003067.1_cds_ROT65593.1_3
ATCTCTNNNNNNNNNNATATCCCCTTTNNNNNCTCTCT
>lcl|QCYY01003067.1_cds_ROT65593.1_4
ATCTCTNNNNNNNNNNATATCCCCTTCTCGGGGCCCC 
Run Code Online (Sandbox Code Playgroud)

我想计算“N”的数量以及每行中出现的模式数量。无需包含标题 (>lcl|QCYY01003067.1_cds_ROT65593.1_2 )

例如:-

 line 2=0,0
 line 4=15,2
 line 6=10,1
Run Code Online (Sandbox Code Playgroud)

如何改进此代码:

grep -n '[{N}]' <filename> | cut -d : -f 1 | uniq -c
Run Code Online (Sandbox Code Playgroud)

shell awk grep design-patterns count

-1
推荐指数
1
解决办法
140
查看次数

标签 统计

awk ×1

count ×1

design-patterns ×1

grep ×1

shell ×1