lst*_*tbl 6 python regex python-itertools
我在python中的re.finditer()方法遇到了一些麻烦.例如:
>>>sequence = 'atgaggagccccaagcttactcgatttaacgcccgcagcctcgccaaaccaccaaacacacca'
>>>[[m.start(),m.end()] for m in re.finditer(r'(?=gatttaacg)',sequence)]
out: [[22,22]]
Run Code Online (Sandbox Code Playgroud)
如您所见,start()和end()方法给出了相同的值.我之前注意到了这一点,并且最终使用了m.start()+len(query_sequence),而不是m.end(),但我很困惑为什么会发生这种情况.
该正则表达式模块支持与finditer重叠:
import regex
sequence = 'acaca'
print [[m.start(), m.end()] for m in regex.finditer(r'(aca)', sequence, overlapped=1)]
[0, 3], [2, 5]]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1205 次 |
| 最近记录: |