我有一个序列文件:
$猫文件 CACCGTTGCCAAACAATG TTAGAAGCCTGTCAGCCT CATTGCTCTCAGACCCAC GATGTACGTCACATTAGA ACACGGAATCTGCTTTTT CAGAATTCCCAAAGATGG
我想计算 C+T 的最长延伸。我只能计算总 C+T,但我想要最长的伸展。
$ cat 文件 | awk '{ 打印 $0, gsub(/[cCtT]/,"",$1)}' CACCGTTGCCAAACAATG 9 TTAGAAGCCTGTCAGCCT 10 CATTGCTCTCAGACCCAC 12 GATGTACGTCACATTAGA 8 ACACGGAATCTGCTTTTT 11 CAGAATTCCCAAAGATGG 7
该预期的结果将显示出最长的C ^ + T舒展。
CACCGTTGCCAAACAATG 9 2 TTAGAAGCCTGTCAGCCT 10 3 CATTGCTCTCAGACCCAC 12 5 GATGTACGTCACATTAGA 8 2 ACACGGAATCTGCTTTTT 11 6 CAGAATTCCCAAAGATGG 7 5