用awk从DSSP中提取螺旋残基

use*_*417 2 awk bioinformatics

我想从DSSP文件中提取螺旋(H)残基.

1CRN.dssp

 31   37 A K  H   < S+
 32   38 A V  H  < S+ 
 33   39 A F  H >< S- 
 34   40 A G  G >< S+ 
 35   41 A K  G >  S+ 
Run Code Online (Sandbox Code Playgroud)

1GB5.dssp

113  242 B G  H 3>>S+
114  243 B I  H <45S+    
115  244 B L  H X45S+     
116  245 B S  H 3<5S+ 
117  246 B K  T >X5S+   
Run Code Online (Sandbox Code Playgroud)

我想以下列格式保存输出.

>1CRN
KVF
>1GB5
GILS
Run Code Online (Sandbox Code Playgroud)

我怎么能用awk做到这一点?您的建议将不胜感激!

she*_*ter 5

第5列中的"H"表示"螺旋(H)残基"?

awk '{
  if (FNR == 1 ) print ">" FILENAME  
  if ($5 == "H") {
    printf $4
  }
} 
END { printf "\n"}'  file
Run Code Online (Sandbox Code Playgroud)

产量

>tstDat.txt
KVF
Run Code Online (Sandbox Code Playgroud)

IHTH