如何在不支持它的正则表达式引擎中按字边界分割?
python的重写可以匹配\ b但似乎不支持拆分它.我似乎记得处理具有相同限制的其他正则表达式引擎.
示例输入:
"hello, foo"
Run Code Online (Sandbox Code Playgroud)
预期产量:
['hello', ', ', 'foo']
Run Code Online (Sandbox Code Playgroud)
实际的python输出:
>>> re.compile(r'\b').split('hello, foo')
['hello, foo']
Run Code Online (Sandbox Code Playgroud)
(\ W +)可以给你预期的输出:
>>> re.compile(r'(\W+)').split('hello, foo')
['hello', ', ', 'foo']
Run Code Online (Sandbox Code Playgroud)