相关疑难解决方法(0)

#!/usr/bin/perl
# quotes-nested.pl

use v5.10;

$_ =<<'HERE';
He said 'Amelia said "I am a camel"'
HERE

say "Matched!" if m/
    (
        ['"]
            ( 
                (?: 
                    [^'"]+
                    | 
                    ( (?1) ) 
                )* 
            )
        ['"]
    )
    /xg;

print "
1 => $1
2 => $2
3 => $3
4 => $4
5 => $5
";

Run Code Online (Sandbox Code Playgroud)

这有效,两个引号显示在$1和$3: …

regex perl named-captures

bri*_*foy

2017 05-23

32
推荐指数

1
解决办法

773
查看次数

是否可以在不使用递归或平衡组的情况下将嵌套括号与正则表达式匹配？

StackOverflow鼓励自己回答问题,所以我决定创建这篇文章来分享我最近发现的东西.

问题:在正则表达式中匹配任意嵌套的括号组,例如Java的java.util.regex,既不支持递归也不支持平衡组.即,匹配3个外部组:

(第一第二第三)))))))

这个练习纯粹是学术性的,因为我们都知道正则表达式不应该被用来匹配这些东西,正如Q-tips不应该被用来清理耳朵一样.

java regex

jay*_*tea

2017 11-09

20
推荐指数

2
解决办法

3090
查看次数

在lookbehind我尝试找到一个~(,然后我使用命名组堆栈Depth来计算无关的开括号.只要打开的括号~(永远不会关闭,那么lookbehind应该匹配.如果到达(?<-Depth>...)那个右括号,则无法从堆栈中弹出任何内容,并且lookbehind应该失败(即,对于所有来自的字母j).不幸的是,这不起作用.相反,我匹配a,b,c,e,f,g和m.所以只有这些:

~(a b (c) _ (e f (g) _) _) _ (_ (_ (m) _) _) _

Run Code Online (Sandbox Code Playgroud)

这似乎意味着,一旦我关闭了一个单一的括号,看起来就无法匹配任何东西,除非我回到我以前最高的嵌套水平.

好吧,这可能只是意味着我的正则表达式有些奇怪,或者我没有正确理解平衡组.但后来我尝试了这个没有外观.我为每个字母创建了一个字符串,如下所示:

~(z …

Run Code Online (Sandbox Code Playgroud)

.net regex lookaround balancing-groups

Mar*_*der

2017 05-23

14
推荐指数

1
解决办法

799
查看次数

使用PCRE匹配n> 0的^ nb ^ nc ^ n

如何将n> 0的^ nb ^ nc ^ n与PCRE匹配？

以下情况应符合:

abc
aabbcc
aaabbbccc

Run Code Online (Sandbox Code Playgroud)

以下情况不符合:

abbc
aabbc
aabbbccc

Run Code Online (Sandbox Code Playgroud)

这是我"尝试过"的东西; /^(a(?1)?b)$/gmx但这匹配n> 0的^ nb ^ n:

ab
aabb
aaabbb

Run Code Online (Sandbox Code Playgroud)

Online demo

注意:这个问题是一样的这一个与语言的变化.

regex pcre

Ham*_*mZa

2017 05-23

14
推荐指数

2
解决办法

2806
查看次数

捕捉量词和量词算术

首先,让我解释一下,这个问题既不是关于如何捕获组,也不是关于如何使用量词,这是我非常熟悉的正则表达式的两个特征.对于可能熟悉异国情调引擎中不寻常语法的正则表达式爱好者而言,这是一个更高级的问题.

捕捉量词

有谁知道正则表达式的味道是否允许你捕捉量词？通过这个,我的意思是计数与+和*等量词匹配的字符数将被计算,并且这个数字可以在另一个量词中再次使用.

例如,假设您要确保在此类字符串中具有相同数量的Ls和Rs:LLLRRRRR

你可以想象一下这样的语法

L(+)R{\q1}

Run Code Online (Sandbox Code Playgroud)

其中捕获了L的+量词,并且在R的量词中将捕获的数字称为{\ q1}

这对平衡{@,=, - ,/}在字符串中的数量很有用,例如@@@@"星球大战"===="1977"----"科幻小说"////"乔治卢卡斯"

与递归的关系

在某些情况下,量词捕获会优雅地替换递归,例如由相同数量的Ls和Rs构成的一段文本,a in

L(+) some_content R{\q1}

Run Code Online (Sandbox Code Playgroud)

这个想法在下面的页面中有一些细节:Captifured Quantifiers

它还讨论了捕获量化的自然扩展:量化算术,适用于您希望匹配(3*x + 1)之前匹配的字符数的情况.

我试图找出这样的事情是否存在.

在此先感谢您的见解!

更新

Casimir给出了一个很棒的答案,它显示了两种方法来验证模式的各个部分具有相同的长度.但是,我不想在日常工作中依赖其中任何一种.这些都是表现出色表演的伎俩.在我看来,这些美丽但复杂的方法证实了这个问题的前提:一个正则表达式特征来捕获量化的字符数(例如+或*)能够匹配将使这种平衡模式非常简单并扩展语法一种令人愉快的表达方式.

更新2(稍后)

我发现.NET有一个接近我所询问的功能.添加了演示该功能的答案.

regex recursion quantifiers

zx8*_*x81

2016 03-17

9
推荐指数

1
解决办法

698
查看次数

表示为String的2D矩阵的正则表达式

我试图在表示为字符串的2D矩阵中搜索模式.请注意以下事项:

// horizontal line
String pat1 =
    "............." +
    "............." +
    "............." +
    "....XXXX....." +
    "............." +
    ".............";

// vertical line
String pat2 =
    "............." +
    "......X......" +
    "......X......" +
    "......X......" +
    "......X......" +
    ".............";

Run Code Online (Sandbox Code Playgroud)

搜索第一个模式将是微不足道的,正则表达式将是这样的:

X+

Run Code Online (Sandbox Code Playgroud)

在第二种情况下,它有点棘手但可行,因为我知道矩阵的列数和行数:

(X.{`WIDTH - 1`})+

Run Code Online (Sandbox Code Playgroud)

当我遇到问题想出正确的正则表达式时,我试图找出一种方法来识别以下模式:

// fixed but unknown number of columns
String pat3 =
    "............." +
    ".....XXX....." +
    ".....XXX....." +
    ".....XXX....." +
    ".....XXX....." +
    ".............";

// variable number of columns
String pat4 =
    "............." +
    ".....XXX....." +
    "....XXXXX...." +
    "...XXXXXXX..." +
    ".....XXX....." …

Run Code Online (Sandbox Code Playgroud)

java regex matrix

Osc*_*nez

2013 11-03

7
推荐指数

1
解决办法

464
查看次数