use*_*417 2 awk bioinformatics
我想从DSSP文件中提取螺旋(H)残基.
1CRN.dssp
31 37 A K H < S+
32 38 A V H < S+
33 39 A F H >< S-
34 40 A G G >< S+
35 41 A K G > S+
Run Code Online (Sandbox Code Playgroud)
1GB5.dssp
113 242 B G H 3>>S+
114 243 B I H <45S+
115 244 B L H X45S+
116 245 B S H 3<5S+
117 246 B K T >X5S+
Run Code Online (Sandbox Code Playgroud)
我想以下列格式保存输出.
>1CRN
KVF
>1GB5
GILS
Run Code Online (Sandbox Code Playgroud)
我怎么能用awk做到这一点?您的建议将不胜感激!
第5列中的"H"表示"螺旋(H)残基"?
awk '{
if (FNR == 1 ) print ">" FILENAME
if ($5 == "H") {
printf $4
}
}
END { printf "\n"}' file
Run Code Online (Sandbox Code Playgroud)
产量
>tstDat.txt
KVF
Run Code Online (Sandbox Code Playgroud)
IHTH