在正则表达式拆分期间发生javascript未定义元素

Mul*_*aag 7 javascript regex

以下代码导致中间的未定义元素

"Hello World\n\nhello world".split(/\n(\n|\t|\s)*?\n/)
"Hello World\n\nhello world".split(/\n(\n|\t|\s)*\n/)
Run Code Online (Sandbox Code Playgroud)

输出是

["Hello World", undefined, "hello world"]
Run Code Online (Sandbox Code Playgroud)

我想拆分,如果有两个新的行字符,它们之间有任意数量的新行,空格或制表符,只要它们不是字母或符号或数字.

Cas*_*yte 7

这是因为当您在拆分模式中使用捕获组时,javascript会在结果中包含捕获组的内容.因为,捕获组不能为空,它永远不会重复,这就是为什么你得到"未定义"而不是空字符串的原因.

要防止这种情况,请使用非捕获组或字符类:

"Hello World\n\nhello world".split(/\n(?:\n|\t|\s)*\n/)
"Hello World\n\nhello world".split(/\n\s*\n/) # (\t and \n are already included in \s)
Run Code Online (Sandbox Code Playgroud)

注意:如果您也想删除前导和尾随空格,可以使用:

/(?:[^\S\n]*\n){2}\s*/
Run Code Online (Sandbox Code Playgroud)


Jos*_*ier 5

使用非捕获组来防止包含捕获组的内容。

/\n(?:\n|\t|\s)*?\n/
Run Code Online (Sandbox Code Playgroud)

它将返回:

"Hello World\n\nhello world".split(/\n(?:\n|\t|\s)*?\n/);
// ["Hello World", "hello world"]
Run Code Online (Sandbox Code Playgroud)