正则表达式:是否有AND运算符?

Hug*_*are 656 regex lookahead

显然,您可以使用|(管道?)来表示OR,但有没有办法表示AND

具体来说,我想匹配包含某个短语的所有文本的段落,但没有特定的顺序.

Jas*_*hen 363

使用非消费正则表达式.

典型的(即Perl/Java)表示法是:

(?=EXPR)

这意味着"匹配expr但在此之后继续匹配原始匹配点".

您可以根据需要执行其中的许多操作,这将是"和".例:

(?=match this expression)(?=match this too)(?=oh, and this)

如果需要在其中保存一些数据,甚至可以在非消费表达式中添加捕获组.

  • 应该提到的是,这个特定的例子被称为正向前瞻性断言.它还有"和"之外的其他用途.请注意,文本未被使用. (24认同)
  • perl -e"q {some stuff and things} =〜/(?=.*some)(?=.*stuff)(?=.*things)/?print'yes':print'no'" (10认同)
  • 像这样使用(?=)会产生一个永远不会成功的正则表达式.但它*是*的结合模拟.OP认为解决他的问题是错误的. (7认同)
  • perl -e "q{some stuff and things} =~ /(?=some)(?=stuff)(?=things)/ ? print 'yes' : print 'no'" 打印 'no'。 (3认同)
  • 你可以在你的答案中添加一些简单的Perl代码示例吗? (3认同)
  • 值得一提的是,japavascript不支持预测. (3认同)

Ala*_*ore 322

你需要像其他一些响应者所说的那样使用前瞻,但是前瞻必须考虑其目标词和当前匹配位置之间的其他字符.例如:

(?=.*word1)(?=.*word2)(?=.*word3)
Run Code Online (Sandbox Code Playgroud)

.*第一先行让它符合它需要它得到"字词1"之前,无论多少个字符.然后重置匹配位置,第二个前瞻搜索"word2".再次重置,最后一部分匹配"word3"; 因为这是你要检查的最后一个词,所以它没有必要在前瞻,但它并没有伤害.

为了匹配整个段落,您需要在两端锚定正则表达式并添加final .*以消耗剩余的字符.使用Perl样式表示法,即:

/^(?=.*word1)(?=.*word2)(?=.*word3).*$/m
Run Code Online (Sandbox Code Playgroud)

'm'修饰符用于多线模式; 它允许^$匹配段落边界(正则表达式中的"行边界").在这种情况下,您必须使用's'修饰符,它允许点元字符匹配换行符以及所有其他字符.

最后,您要确保匹配整个单词而不仅仅是较长单词的片段,因此您需要添加单词边界:

/^(?=.*\bword1\b)(?=.*\bword2\b)(?=.*\bword3\b).*$/m
Run Code Online (Sandbox Code Playgroud)

  • 非常感谢.*这有所不同 (9认同)
  • 完全正确 - 还有一个关于此的教程!http://ocpsoft.org/tutorials/regular-expressions/and-in-regex/ (6认同)
  • +1表示清晰简洁的答案,展示了前瞻的最佳用途之一(与黑客计算密码匹配百分比等用途不同)。:) (4认同)
  • 如果在javascript中使用新的行作为`.`在javascript的正则表达式引擎中使用`.`替换`.``,则将`.*`替换为新的行,并且无法使用修饰符 (3认同)

fan*_*abi 32

看看这个例子:

我们有2个正则表达式A和B,我们想要匹配它们,所以在伪代码中它看起来像这样:

pattern = "/A AND B/"
Run Code Online (Sandbox Code Playgroud)

它可以在不使用AND运算符的情况下编写,如下所示:

pattern = "/NOT (NOT A OR NOT B)/"
Run Code Online (Sandbox Code Playgroud)

在PCRE中:

"/(^(^A|^B))/"

regexp_match(pattern,data)
Run Code Online (Sandbox Code Playgroud)

  • 在正则表达式语法中,"^"是指"字符串的开头"吗? (36认同)
  • 这在形式逻辑方面是正确的,但在这里绝对没有帮助.在正则表达式中,NOT比AND更难表达. (23认同)
  • 这个完全错误的答案怎么会得到如此多的支持?!在 `/(^(^A|^B))/` PCRE 中,`^` 表示“行的开头”而不是否定。也许人们可以通过[负向前瞻](https://www.regular-expressions.info/lookaround.html) (`(?!…)`,例如`(?!(?!A)|(? !B))`),但肯定不是用 `^`。 (6认同)
  • 通常在正则表达式中,`^` 仅在字符类的开头表示否定。除非 CMake 正在做一些非常时髦的事情(以至于将他们的模式匹配语言称为“正则表达式”可能会被视为误导或不正确),我猜测它对您有用的事实是一个孤立的事故。 (4认同)

Juh*_*älä 29

你可以用正则表达式做到这一点,但可能你会想要其他的.例如,使用几个正则表达式并将它们组合在一个if子句中.

您可以使用标准正则表达式枚举所有可能的排列,如下所示(按任意顺序匹配a,b和c):

(abc)|(bca)|(acb)|(bac)|(cab)|(cba)
Run Code Online (Sandbox Code Playgroud)

但是,如果您有多个术语,这会产生一个非常长且可能效率低下的正则表达式.

如果你使用的是一些扩展的正则表达式版本,比如Perl或Java,他们有更好的方法来做到这一点.其他答案建议使用积极的先行操作.

  • 我不认为你的方法比他们的灾难性回溯的3个前瞻更低效.当然,写入时间较长,但请注意,您可以轻松自动生成模式.请注意,使用`a(bc | cb)| b(ac | ca)| c(ab | ba)`可以提高它的速度.最重要的是,你可以使用它与所有正则表达的味道. (10认同)

Ema*_*nde 23

AND运算符隐含在RegExp语法中.
相反,OR运算符用管道指定.
以下RegExp:

var re = /ab/;
Run Code Online (Sandbox Code Playgroud)

是指字母a 字母b.
它也适用于群组:

var re = /(co)(de)/;
Run Code Online (Sandbox Code Playgroud)

它意味着团体co 团体de.
用OR替换(隐式)AND将需要以下行:

var re = /a|b/;
var re = /(co)|(de)/;
Run Code Online (Sandbox Code Playgroud)

  • 不幸的是,这不是OP所要求的.这可以按顺序查找任何内容,而他们可以按任何顺序查找它们.请查看http://stackoverflow.com/users/20938/alan-moore下面的答案,这是正确的答案. (26认同)
  • @JESii 谢谢你的观点,你是对的,我误解了 Hugoware 的问题,我特别关注他的第一句话。正如 AlanMoore 所写,正确的答案是正确使用先行运算符。无论如何,我认为有人可能会发现我的澄清有用,因为它已经被投票了,所以我不会扔掉所有东西。问候。 (2认同)

use*_*579 11

在您的情况下,在几个匹配结果上进行AND是不可能的吗?在伪代码中

regexp_match(pattern1, data) && regexp_match(pattern2, data) && ...
Run Code Online (Sandbox Code Playgroud)

  • 我遇到的情况是,我有一些代码是规则的数据表,并且带有一个正则表达式模式匹配字符串来测试规则的有效性。在我的情况下,我无法进行多项测试,在其他人的情况下,也是如此! (3认同)

mug*_*896 11

为什么不用awk?
与awk正则表达式和,或者事情是如此简单

awk '/WORD1/ && /WORD2/ && /WORD3/' myfile
Run Code Online (Sandbox Code Playgroud)


jpa*_*cek 9

如果使用Perl正则表达式,则可以使用正向前瞻:

例如

(?=[1-9][0-9]{2})[0-9]*[05]\b
Run Code Online (Sandbox Code Playgroud)

将是大于100的数字并且可以被5整除


gar*_*tor 8

您可以将输出传输到另一个正则表达式.使用grep,你可以这样做:

grep A | grep B


Dev*_*vWL 8

除了接受的答案

我将为您提供一些实用的例子,让您的一些人更清楚.例如,假设我们有三行文字:

[12/Oct/2015:00:37:29 +0200] // only this + will get selected
[12/Oct/2015:00:37:x9 +0200]
[12/Oct/2015:00:37:29 +020x]
Run Code Online (Sandbox Code Playgroud)

在这里看演示 DEMO

我们在这里要做的是选择+符号,但前提是它是在带有空格的两个数字之后,如果它在四个数字之前.这些是唯一的限制因素.我们将使用此正则表达式来实现它:

'~(?<=\d{2} )\+(?=\d{4})~g'
Run Code Online (Sandbox Code Playgroud)

请注意,如果您将表达式分开,它将为您提供不同的结果.

或许你想在标签之间选择一些文字......但不是标签!然后你可以使用:

'~(?<=<p>).*?(?=<\/p>)~g'
Run Code Online (Sandbox Code Playgroud)

对于这个文字:

<p>Hello !</p> <p>I wont select tags! Only text with in</p> 
Run Code Online (Sandbox Code Playgroud)

在这里看演示 DEMO


hrs*_*hrs 7

((yes).*(no))|((no).*(yes))

将匹配同时包含yes和的句子,无论它们出现的顺序如何:no

Do i like cookies? **Yes**, i do. But milk - **no**, definitely no.

**No**, you may not have my phone. **Yes**, you may go f yourself.

两者都会匹配,忽略大小写。


pil*_*lif 5

该顺序始终隐含在正则表达式的结构中。为了完成所需的操作,您必须针对不同的表达式多次匹配输入字符串。

单个正则表达式是不可能做到的。

  • 可能是因为这不仅可能,而且很简单,假设您的regex风格支持先行。那是一个很好的选择;当今大多数主要的编程语言都支持它们。 (12认同)

Ham*_*han 5

在正则表达式之外使用 AND。在 PHP 前瞻运算符似乎对我不起作用,而是我使用了这个

if( preg_match("/^.{3,}$/",$pass1) && !preg_match("/\s{1}/",$pass1))
    return true;
else
    return false;
Run Code Online (Sandbox Code Playgroud)

如果密码长度为 3 个字符或更多并且密码中没有空格,则上述正则表达式将匹配。


loc*_*wei 5

这是“and”运算符的可能“形式”:

以以下正则表达式为例:

如果我们想匹配没有“e”字符的单词,我们可以这样做:

/\b[^\We]+\b/g
Run Code Online (Sandbox Code Playgroud)
  • \W表示不是“单词”字符。
  • ^\W表示“单词”字符。
  • [^\We]表示“word”字符,但不是“e”。

看看它的实际应用:不带 e 的单词

正则表达式的“and”运算符

我认为这种模式可以用作正则表达式的“ and ”运算符。

一般来说,如果:

  • A = not a
  • B = not b

然后:

[^AB] = not(A or B) 
      = not(A) and not(B) 
      = a and b
Run Code Online (Sandbox Code Playgroud)

差异集

因此,如果我们想在正则表达式中实现差异集的概念,我们可以这样做:

a - b = a and not(b)
      = a and B
      = [^Ab]
Run Code Online (Sandbox Code Playgroud)