我试图在Python 2.7.2中使用正则表达式从字符串中提取所有出现的标记词.或者简单地说,我想提取[p][/p]标签内的每一段文字.这是我的尝试:
regex = ur"[\u005B1P\u005D.+?\u005B\u002FP\u005D]+?"
line = "President [P] Barack Obama [/P] met Microsoft founder [P] Bill Gates [/P], yesterday."
person = re.findall(pattern, line)
Run Code Online (Sandbox Code Playgroud)
印刷person生产['President [P]', '[/P]', '[P] Bill Gates [/P]']
什么是正确的正则表达式:['[P] Barack Obama [/P]', '[P] Bill Gates [/p]']
或['Barrack Obama', 'Bill Gates'].
谢谢.:)