从JS变量构建正则表达式不起作用

Geo*_*org 5 javascript regex

我试图从静态文本加上javascript中的变量构建一个正则表达式.显然我遗漏了一些非常基本的东西,请参阅下面的代码中的注释.非常感谢帮助:

var test_string = "goodweather";

// One regexp we just set: 
var regexp1 = /goodweather/;

// The other regexp we built from a variable + static text:
var regexp_part = "good";
var regexp2 = "\/" + regexp_part + "weather\/";

// These alerts now show the 2 regexp are completely identical:
alert (regexp1);
alert (regexp2);

// But one works, the other doesn't ??
if (test_string.match(regexp1))
  alert ("This is displayed.");

if (test_string.match(regexp2))
  alert ("This is not displayed.");
Run Code Online (Sandbox Code Playgroud)

rid*_*ner 17

首先,问题的答案:

其他答案几乎是正确的,但是没有考虑当要匹配的文本包含文字反斜杠时会发生什么(即,当:regexp_part包含文字反斜杠时).例如,regexp_part等于时会发生什么"C:\Windows"?在这种情况下,建议的方法不能按预期工作(生成的正则表达式变为:/C:\Windows/\W错误地解释为非单词字符类).正确的解决方案是首先逃避任何反斜杠regexp_part(所需的正则表达式实际上是:) /C:\\Windows/.

为了说明正确的处理方法,这里有一个函数,它接受一个传递的短语并创建一个正则表达式,其中包含在\b单词边界中的短语:

// Given a phrase, create a RegExp object with word boundaries.
function makeRegExp(phrase) {
    // First escape any backslashes in the phrase string.
    //  i.e. replace each backslash with two backslashes.
    phrase = phrase.replace(/\\/g, "\\\\");
    // Wrap the escaped phrase with \b word boundaries.
    var re_str = "\\b"+ phrase +"\\b";
    // Create a new regex object with "g" and "i" flags set.
    var re = new RegExp(re_str, "gi");
    return re;
}
// Here is a condensed version of same function.
function makeRegExpShort(phrase) {
    return new RegExp("\\b"+ phrase.replace(/\\/g, "\\\\") +"\\b", "gi");
}
Run Code Online (Sandbox Code Playgroud)

为了更深入地理解这一点,以下是一个讨论......

深入讨论,或"所有这些反斜杠的内容!?"

JavaScript有两种创建RegExp对象的方法:

  1. / pattern/flags - 您可以直接指定RegExp Literal表达式,其中使用一对正斜杠后跟三个模式修饰符标志的任意组合来分隔模式:即'g'global,'i'ignore-case或'm'multi-line.无法动态创建此类正则表达式.
  2. new RegExp("pattern","flags") - 您可以通过调用RegExp()构造函数创建一个RegExp对象,并将该模式​​作为字符串(不带正斜杠分隔符)作为第一个参数和可选的模式修饰符标记(也作为一个string)作为第二个(可选)参数.可以动态创建此类正则表达式.

以下示例演示如何使用这两种方法创建一个简单的RegExp对象.让我们说我们希望匹配这个词"apple".我们需要的正则表达式模式很简单:apple.另外,我们希望设置所有三个修饰符标志.

示例1:没有特殊字符的简单模式: apple

// A RegExp literal to match "apple" with all three flags set:
var re1 = /apple/gim;

// Create the same object using RegExp() constructor:
var re2 = new RegExp("apple", "gim");
Run Code Online (Sandbox Code Playgroud)

很简单.但是,这两种方法在处理转义字符方面存在显着差异.正则表达式文字语法非常方便,因为您只需要转义正斜杠 - 所有其他字符都不会直接传递给正则表达式引擎.但是,在使用RegExp构造函数方法时,将模式作为字符串传递,并且有两个级别的转义要考虑; 第一个是字符串的解释,第二个是正则表达式引擎的解释.几个例子将说明这些差异.

首先,我们考虑一个包含单个字面正斜杠的模式.假设我们希望匹配文本序列:"and/or"以不区分大小写的方式.所需的模式是:and/or.

示例2:具有一个正斜杠的模式: and/or

// A RegExp literal to match "and/or":
var re3 = /and\/or/i;

// Create the same object using RegExp() :
var re4 = new RegExp("and/or", "i");
Run Code Online (Sandbox Code Playgroud)

请注意,使用正则表达式文字语法时,必须转义正斜杠(前面带有一个反斜杠),因为使用正则表达式文字时,正斜杠具有特殊含义(它是一个特殊的元字符,用于分隔模式).另一方面,使用RegExp构造函数语法(使用字符串存储模式),正斜杠没有任何特殊含义,也不需要转义.

接下来让我们考虑一个包含特殊的模式:\b单词边界正则表达式元序列.假设我们希望创建一个正则表达式来匹配单词"apple"作为整个单词(这样它就不匹配"pineapple").模式(由正则表达式引擎看到)需要是\bapple\b:

示例3:具有\b字边界的图案:\bapple\b

// A RegExp literal to match the whole word "apple":
var re5 = /\bapple\b/;

// Create the same object using RegExp() constructor:
var re6 = new RegExp("\\bapple\\b");
Run Code Online (Sandbox Code Playgroud)

在这种情况下,使用RegExp构造函数方法时必须转义反斜杠,因为模式存储在字符串中,并且要将字符串反斜杠转换为字符串,必须使用另一个反斜杠进行转义.但是,使用正则表达式文字,没有必要逃避反斜杠.(请记住,使用正则表达式文字时,唯一特殊的元字符是正斜杠.)

反斜杠SOUP!

当我们需要匹配字面反斜杠时,事情变得更加有趣.假设我们想匹配文本序列:"C:\Program Files\JGsoft\RegexBuddy3\RegexBuddy.exe".正则表达式引擎要处理的模式需要是:C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe.(请注意,匹配单个反斜杠的正则表达式模式\\即每个都必须进行转义.)以下是使用两种JavaScript语法创建所需RegExp对象的方法

示例4:匹配文字反斜杠的模式:

// A RegExp literal to match the ultimate Windows regex debugger app:
var re7 = /C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe/;

// Create the same object using RegExp() constructor:
var re8 = new RegExp(
    "C:\\\\Program Files\\\\JGsoft\\\\RegexBuddy3\\\\RegexBuddy\\.exe");
Run Code Online (Sandbox Code Playgroud)

这就是为什么/regex literal/语法通常优于该new RegExp("pattern", "flags")方法的原因 - 它完全避免了经常出现的反斜杠汤.但是,当你需要动态创建一个正则表达式时,正如OP需要的那样,你被迫使用new RegExp()语法并处理反斜杠汤.(一旦你的头被包裹起来,它真的不是那么糟糕.)

RegexBuddy救援!

RegexBuddy是一个Windows应用程序,它可以帮助解决这个反斜杠汤问题 - 它了解正则表达式语法和许多语言的转义要求,并且在粘贴应用程序时会根据需要自动添加和删除反斜杠.在应用程序内部,您可以使用本机正则表达式格式编写和调试正则表达式.一旦正则表达式正常工作,您可以使用众多"copy as ..."选项之一导出它以获得所需的语法.非常方便!


Xio*_*ion 1

正斜杠只是包含正则表达式的 Javascript 语法。如果您使用普通字符串作为正则表达式,则不应包含它们,因为它们将被匹配。因此你应该像这样构建正则表达式:

var regexp2 = regexp_part + "weather";
Run Code Online (Sandbox Code Playgroud)