enter code here我有一个包含序列的 fasta 文件
>lcl|QCYY01003067.1_cds_ROT65593.1_2
ATGCGTCTCCCCTTTAGAGAGTTCTCTCTAGCTACGTA
>lcl|QCYY01003067.1_cds_ROT65593.1_3
ATCTCTNNNNNNNNNNATATCCCCTTTNNNNNCTCTCT
>lcl|QCYY01003067.1_cds_ROT65593.1_4
ATCTCTNNNNNNNNNNATATCCCCTTCTCGGGGCCCC
Run Code Online (Sandbox Code Playgroud)
我想计算“N”的数量以及每行中出现的模式数量。无需包含标题 (>lcl|QCYY01003067.1_cds_ROT65593.1_2 )
例如:-
line 2=0,0
line 4=15,2
line 6=10,1
Run Code Online (Sandbox Code Playgroud)
如何改进此代码:
grep -n '[{N}]' <filename> | cut -d : -f 1 | uniq -c
Run Code Online (Sandbox Code Playgroud)