我有一个具有以下格式的文件,其中每行的字段数是可变的:
NC_000001.11_NM_001005484.2 69270 234 69037 65565 69037
NC_000001.11_NM_001005484.2 69511 475 69037 65565 69037
NC_000001.11_NM_001005484.2 69761 725 69037 65565 69037
NC_000001.11_NM_001385640.1 942155 20 942136 924432 925922 930155 931039 935772 939040 939272 941144 942136 942410 942559 943253 943698 943908
Run Code Online (Sandbox Code Playgroud)
对于每一行,我想打印前四个字段。对于其余字段($5 到 NF),如果这些字段中的值小于 $4 中的值,我想打印该字段。
输出示例:
NC_000001.11_NM_001005484.2 69270 234 69037 65565
NC_000001.11_NM_001005484.2 69511 475 69037 65565
NC_000001.11_NM_001005484.2 69761 725 69037 65565
NC_000001.11_NM_001385640.1 942155 20 942136 924432 925922 930155 931039 935772 939040 939272 941144
Run Code Online (Sandbox Code Playgroud)
我尝试过多种不同的 awk 选项,但都失败了。awk 新手,希望得到任何帮助。
awk ×1