这是一系列教育正则表达式文章的第二部分.它显示了向前看符号和嵌套引用如何可以用来匹配非正规languge ñ b ñ.嵌套引用首先介绍在:这个正则表达式如何找到三角形数字?
其中一种原型非常规语言是:
L = { añbñ: n > 0 }
这是所有非空字符串的语言,由一些数字a后跟相同数量的字符串组成b.在这个语言字符串的例子有ab,aabb,aaabbb.
这种语言可以通过泵浦引理显示为非规则的.它实际上是一种原型上下文无关语言,可以通过无上下文语法 生成S ? aSb | ab.
尽管如此,现代正则表达式实现清楚地认识到的不仅仅是常规语言.也就是说,它们不是形式语言理论定义的"规则".PCRE和Perl支持递归正则表达式,.NET支持平衡组定义.更少的"花哨"特征,例如反向引用匹配,意味着正则表达式不规则.
但这个"基本"功能有多强大?L例如,我们可以用Java正则表达式识别吗?我们也许可以结合lookarounds和嵌套引用,并具有与如工作模式String.matches来匹配字符串一样ab,aabb,aaabbb,等?
java.util.regex.Pattern假设我们有一个包含不同括号的字符串(在此上下文中用括号表示(,[和{),字符串也可以包含其他类似的内容,{[balanced(parenthesis)]}但其余内容将在很大程度上被忽略.是否可以使用正则表达式来控制所有不同的括号:
示例php regex(下面)使用子例程调用来工作.
如果我尝试将它与C#Regex类一起使用,我会收到一个错误: Unrecognized grouping construct
是否可以将其重写为C#regex语法?
它是一个简单的翻译,还是需要使用另一种(正则表达式)方法?
如果它不可能是它所使用的东西的名称是什么,那么我可以将它添加到这个问题中,以使其对具有相同问题的其他人更有用吗?
$pcre_regex = '
/
(?(DEFINE)
(?<number> -? (?: [1-9]\d*| 0 ) (\.\d+)? (e [+-]? \d+)? )
(?<boolean> true | false | null )
(?<string> " (?>[^"\\\\]+ | \\\\ ["\\\\bfnrt\/] | \\\\ u [0-9a-f]{4} )* " )
(?<array> \[ (?: (?&json) (?: , (?&json) )* )? \s* \] )
(?<pair> \s* (?&string) \s* : (?&json) )
(?<object> \{ (?: (?&pair) (?: , (?&pair) )* )? \s* \} ) …Run Code Online (Sandbox Code Playgroud)