当您的正则表达式引擎不支持时,按\ b拆分

ʞɔı*_*ɔıu 4 python regex

如何在不支持它的正则表达式引擎中按字边界分割?

python的重写可以匹配\ b但似乎不支持拆分它.我似乎记得处理具有相同限制的其他正则表达式引擎.

示例输入:

"hello, foo"
Run Code Online (Sandbox Code Playgroud)

预期产量:

['hello', ', ', 'foo']
Run Code Online (Sandbox Code Playgroud)

实际的python输出:

>>> re.compile(r'\b').split('hello, foo')
['hello, foo']
Run Code Online (Sandbox Code Playgroud)

CMS*_*CMS 9

(\ W +)可以给你预期的输出:

>>> re.compile(r'(\W+)').split('hello, foo')
['hello', ', ', 'foo']
Run Code Online (Sandbox Code Playgroud)