我正在尝试从某些文本中删除wiki格式,以便可以对其进行解析.
删除两个分隔符('[['和']]')它们之间的所有文本的最pythonic方法是什么?给定的字符串将包含多次出现的分隔符对.
Chr*_*gan 12
正则表达式非常适合您的问题.
>>> import re
>>> input_str = 'foo [[bar]] baz [[etc.]]'
Run Code Online (Sandbox Code Playgroud)
如果你想要删除整体[[...]],我认为你在问什么,
>>> re.sub(r'\[\[.*?\]\]', '', input_str)
'foo baz '
Run Code Online (Sandbox Code Playgroud)
如果你想留下内容[[...]],
>>> re.sub(r'\[\[(.*?)\]\]', r'\1', input_str)
'foo bar baz etc.'
Run Code Online (Sandbox Code Playgroud)