我有一个包含多行的 .txt 文件,其中提供了氨基酸和残基数据。数据如下所示:
ARG262-Side ASP368-Side 140,83%
ARG95-Side GLU107-Side 103,73%
ARG474-Side VAL468-Main 94,93%
PHE169-Main ALA190-Main 94,63%
THR205-Side ASP203-Side 94,07%
ILE299-Main LYS249-Main 94%
LEU354-Main LYS365-Main 93,6%
ARG346-Side GLU263-Side 93,57%
LEU301-Main ALA247-Main 93,43%
ALA190-Main PHE169-Main 93,37%
SER252-Side ASP296-Side 93,1%
TYR424-Side ASN446-Main 93%
Run Code Online (Sandbox Code Playgroud)
我可以粗略地说,数字表示残基,字母表示氨基酸。因此,在每行的第一个和第二个字段中, 之前的部分-
由氨基酸标识符和残基值组成。我只想打印看到残基值在特定范围内的行,而不管氨基酸如何,也不管第一个或第二个字段是否与标准匹配。
例如,从上面的输入文件中,我想提取仅包含300-425之间的残基的数据。在这种情况下,我的输出应如下所示:
ARG262-Side ASP368-Side 140,83%
LEU354-Main LYS365-Main 93,6%
ARG346-Side GLU263-Side 93,57%
LEU301-Main ALA247-Main 93,43%
TYR424-Side ASN446-Main 93%
Run Code Online (Sandbox Code Playgroud)
我尝试grep
为此使用该命令,但我不是很成功。除了 ,还有其他我可以使用的命令grep
吗?