小编nac*_*cho的帖子

寻找连续重复单词时,Python后视正则表达式"固定宽度模式"错误

我有一个单词分隔的文本.,有2个和3个连续重复单词的实例:

My.name.name.is.Inigo.Montoya.You.killed.my.father.father.father.Prepare.to.die-

我需要将它们与正则表达式独立匹配,不包括重复项的重复项.

因为有最大值 这连续3个重复的话

r'\b(\w+)\.+\1\.+\1\b'

成功捕获

father.father.father

但是,为了捕获2个连续重复的单词,我需要确保下一个和前一个单词不一样.我可以做一个负面的预测

r'\b(\w+)\.+\1(?!\.+\1)\b'

但我的尝试是消极的后视

r'(?<!(\w)\.)\b\1\.+\1\b(?!\.\1)'

要么返回一个固定宽度的问题(当我保留+)或其他一些问题.

我应该如何纠正负面的背后

python regex negative-lookahead regex-lookarounds

5
推荐指数
1
解决办法
250
查看次数