模糊字符串与grep匹配

Ssa*_*ank 6 regex shell pattern-matching

我试图匹配包含字符串的文件中的行说ACTGGGTAAACTA.如果我做

grep "ACTGGGTAAACTA" file 
Run Code Online (Sandbox Code Playgroud)

它给了我完全匹配的行.有没有办法允许一定数量的不匹配(替换,插入或删除)?例如,我正在寻找序列

  1. 最多3个允许的格式,如"AGTGGGTAACCAA"等.

  2. 插入/删除(部分匹配,如"ACTGGGAAAATAAACTA"或"ACTAAACTA")

tri*_*eee 5

曾经有一个agrep用于模糊正则表达式匹配的工具,但是它被放弃了。

http://en.wikipedia.org/wiki/Agrep已有一些历史并链接到相关工具。

https://github.com/Wikinaut/agrep看起来像是复活的开源版本,但我尚未对其进行测试。

失败了,看看是否可以找到tre-agrep您的发行版。


The*_*Hat 0

简短的回答:不。

长答案:正如@JDB所说,正则表达式本质上是精确的。您可以手动添加不匹配项,例如[ATGC]代替A在某些位置添加,但无法仅允许少量不匹配项。我建议你编写自己的代码来解析它,或者尝试在某处找到 DNA 解析器。