如何在JavaScript中连接正则表达式文字?

eye*_*ess 132 javascript regex syntax

可以这样做吗?

var pattern = /some regex segment/ + /* comment here */
    /another segment/;
Run Code Online (Sandbox Code Playgroud)

或者我是否必须使用新RegExp()语法并连接字符串?我更喜欢使用文字,因为代码更加不言而喻.

Jer*_*rub 177

以下是如何在不使用正则表达式文字语法的情况下创建正则表达式.这使您可以在变为正则表达式对象之前进行仲裁字符串操作:

var segment_part = "some bit of the regexp";
var pattern = new RegExp("some regex segment" + /*comment here */
              segment_part + /* that was defined just now */
              "another segment");
Run Code Online (Sandbox Code Playgroud)

如果你有两个正则表达式文字,你实际上可以使用这种技术连接它们:

var regex1 = /foo/g;
var regex2 = /bar/y;
var flags = (regex1.flags + regex2.flags).split("").sort().join("").replace(/(.)(?=.*\1)/g, "");
var regex3 = new RegExp(expression_one.source + expression_two.source, flags);
// regex3 is now /foobar/gy
Run Code Online (Sandbox Code Playgroud)

它只是比单词表达式更多而且只是文字字符串而不是文字正则表达式.

  • 请记住,使用此方法时,每个段都必须是有效的正则表达式。构造诸如`new RegExp(/(/.source + /.*/.source + /)?/.source);` 之类的表达式似乎不起作用。 (2认同)
  • 你从哪里得到“expression_one”?你的意思是“regex1”吗? (2认同)

小智 24

只是随机连接正则表达式对象可能会产生一些不良副作用.改为使用RegExp.source:

var r1 = /abc/g;
var r2 = /def/;
var r3 = new RegExp(r1.source + r2.source, 
                   (r1.global ? 'g' : '') 
                   + (r1.ignoreCase ? 'i' : '') + 
                   (r1.multiline ? 'm' : ''));
var m = 'test that abcdef and abcdef has a match?'.match(r3);
// m should contain 2 matches
Run Code Online (Sandbox Code Playgroud)

这还使您能够使用标准RegExp标志保留先前RegExp中的正则表达式标志.

的jsfiddle


小智 18

我不太同意"eval"选项.

var xxx = /abcd/;
var yyy = /efgh/;
var zzz = new RegExp(eval(xxx)+eval(yyy));
Run Code Online (Sandbox Code Playgroud)

会给出"// abcd // efgh //"这不是预期的结果.

使用像源

var zzz = new RegExp(xxx.source+yyy.source);
Run Code Online (Sandbox Code Playgroud)

将给出"/ abcdefgh /",这是正确的.

Logicaly没有必要进行评估,你知道你的表达.你只需要它的来源或如何写它不是必要的价值.至于标志,你只需要使用RegExp的可选参数.

在我的情况下,我运行的问题是^和$在几个表达式中使用我试图连接在一起!这些表达式是整个程序使用的语法过滤器.现在我不想将它们中的一些用在一起来处理PREPOSITIONS的情况.我可能需要"切片"来源以删除开始和结束^(和/或)$ :)干杯,Alex.


Mik*_*yer 7

问题如果正则表达式包含像\ 1这样的反向匹配组.

var r = /(a|b)\1/  // Matches aa, bb but nothing else.
var p = /(c|d)\1/   // Matches cc, dd but nothing else.
Run Code Online (Sandbox Code Playgroud)

然后只是连接源将无法正常工作.实际上,两者的结合是:

var rp = /(a|b)\1(c|d)\1/
rp.test("aadd") // Returns false
Run Code Online (Sandbox Code Playgroud)

解决方案: 首先我们计算第一个正则表达式中匹配组的数量,然后对于第二个正则表达式中的每个反向匹配标记,我们将它增加匹配组的数量.

function concatenate(r1, r2) {
  var count = function(r, str) {
    return str.match(r).length;
  }
  var numberGroups = /([^\\]|^)(?=\((?!\?:))/g; // Home-made regexp to count groups.
  var offset = count(numberGroups, r1.source);    
  var escapedMatch = /[\\](?:(\d+)|.)/g;        // Home-made regexp for escaped literals, greedy on numbers.
  var r2newSource = r2.source.replace(escapedMatch, function(match, number) { return number?"\\"+(number-0+offset):match; });
  return new RegExp(r1.source+r2newSource,
      (r1.global ? 'g' : '') 
      + (r1.ignoreCase ? 'i' : '')
      + (r1.multiline ? 'm' : ''));
}
Run Code Online (Sandbox Code Playgroud)

测试:

var rp = concatenate(r, p) // returns  /(a|b)\1(c|d)\2/
rp.test("aadd") // Returns true
Run Code Online (Sandbox Code Playgroud)

  • 是(我不会在这里修改它).这个函数是关联的,所以你可以使用下面的代码:`function concatenateList(){var res = arguments [0]; for(var i = 1; i <arguments.length; i ++){res = concatenate(res,arguments [i]); } return res; }` (2认同)

ant*_*oni 5

提供了:

  • 你知道你在正则表达式中做了什么;
  • 你有许多正则表达式组成一个模式,它们将使用相同的标志;
  • 你发现将你的小模式块分成一个数组更容易阅读;
  • 您还希望能够为下一个开发人员或您自己稍后评论每个部分;
  • 您更喜欢在视觉上简化您的正则表达式,/this/g而不是new RegExp('this', 'g');
  • 您可以在一个额外的步骤中组装正则表达式,而不是从一开始就将其放在一个整体中;

那么你可能喜欢这样写:

var regexParts =
    [
        /\b(\d+|null)\b/,// Some comments.
        /\b(true|false)\b/,
        /\b(new|getElementsBy(?:Tag|Class|)Name|arguments|getElementById|if|else|do|null|return|case|default|function|typeof|undefined|instanceof|this|document|window|while|for|switch|in|break|continue|length|var|(?:clear|set)(?:Timeout|Interval))(?=\W)/,
        /(\$|jQuery)/,
        /many more patterns/
    ],
    regexString  = regexParts.map(function(x){return x.source}).join('|'),
    regexPattern = new RegExp(regexString, 'g');
Run Code Online (Sandbox Code Playgroud)

然后,您可以执行以下操作:

string.replace(regexPattern, function()
{
    var m = arguments,
        Class = '';

    switch(true)
    {
        // Numbers and 'null'.
        case (Boolean)(m[1]):
            m = m[1];
            Class = 'number';
            break;

        // True or False.
        case (Boolean)(m[2]):
            m = m[2];
            Class = 'bool';
            break;

        // True or False.
        case (Boolean)(m[3]):
            m = m[3];
            Class = 'keyword';
            break;

        // $ or 'jQuery'.
        case (Boolean)(m[4]):
            m = m[4];
            Class = 'dollar';
            break;

        // More cases...
    }

    return '<span class="' + Class + '">' + m + '</span>';
})
Run Code Online (Sandbox Code Playgroud)

在我的特殊情况下(类似代码镜像的编辑器),执行一个大的正则表达式要容易得多,而不是像下面这样的大量替换,因为每次我用 html 标签替换来包装一个表达式时,下一个模式将在不影响 html 标签本身的情况下更难定位(并且没有javascript 不支持的良好的lookbehind):

.replace(/(\b\d+|null\b)/g, '<span class="number">$1</span>')
.replace(/(\btrue|false\b)/g, '<span class="bool">$1</span>')
.replace(/\b(new|getElementsBy(?:Tag|Class|)Name|arguments|getElementById|if|else|do|null|return|case|default|function|typeof|undefined|instanceof|this|document|window|while|for|switch|in|break|continue|var|(?:clear|set)(?:Timeout|Interval))(?=\W)/g, '<span class="keyword">$1</span>')
.replace(/\$/g, '<span class="dollar">$</span>')
.replace(/([\[\](){}.:;,+\-?=])/g, '<span class="ponctuation">$1</span>')
Run Code Online (Sandbox Code Playgroud)


Jef*_*ery 5

您可以从文字和 RegExp 类连接正则表达式源:

var xxx = new RegExp(/abcd/);
var zzz = new RegExp(xxx.source + /efgh/.source);
Run Code Online (Sandbox Code Playgroud)