我试图匹配包含字符串的文件中的行说ACTGGGTAAACTA.如果
我做
我做
grep "ACTGGGTAAACTA" file
它给了我完全匹配的行.有没有办法允许一定数量的不匹配(替换,插入或删除)?例如,我正在寻找序列
>最多3个允许的格式,如“AGTGGGTAACCAA”等.
>插入/删除(部分匹配,如“ACTGGGAAAATAAACTA”或“ACTAAACTA”)
曾经有一个名为agrep的工具用于模糊正则表达式匹配,但它被放弃了.
http://en.wikipedia.org/wiki/Agrep有一些历史和相关工具的链接.
https://github.com/Wikinaut/agrep看起来像是一个复活的开源版本,但我还没有测试过它.
如果做不到这一点,看看你是否能为你的发行版找到tre-agrep.