维基百科信息框需要RegEx

Dr.*_*eon 4 php regex wikipedia wikipedia-api

好的,所以这就是我需要的:

  • 我们有维基百科文章的完整XML
  • 我们只需要信息框部分

我尝试了各种各样的东西,但我的主要问题似乎是无法匹配"内部"花括号.任何想法(或任何你设法完成这个的正则表达式?)

对于那些不知道我在说什么的人,这里有一个(有点删节)我正在试图解析的例子:http: //regexr.com?3829

(需要的是{{Infobox *******直到其相应的右括号(}})之间的部分.

Bry*_*ott 9

好,我知道了!

试试这个..:

(?=\{Infobox)(\{([^{}]|(?1))*\})
Run Code Online (Sandbox Code Playgroud)

这是工作示例:

http://regex101.com/r/kT1jF4