正则表达式:仅在不以特定顺序结束时匹配

Kev*_*nle 16 regex

我想测试一个不以.html结尾的网址

这是我提出的模式:

[/\w\.-]+[^\.html$]

Run Code Online (Sandbox Code Playgroud)

以下匹配,因为它不以.html结尾

/blog/category/subcategory/

Run Code Online (Sandbox Code Playgroud)

这不匹配,因为它以.html结尾:

/blog/category/subcategory/index.html

Run Code Online (Sandbox Code Playgroud)

但是,以下内容不匹配,虽然我希望它匹配,因为它以.ht而不是.html结尾

/blog/category/subcategory/index.ht

Run Code Online (Sandbox Code Playgroud)

我应该如何改变我的模式？

如果正则表达式引擎支持,则可以使用负向lookbehind断言:

^[/\w\.-]+(?<!\.html)$

Run Code Online (Sandbox Code Playgroud)

如果你没有lookbehind断言,但你确实有前瞻,那么你可以使用它:

^(?!.*\.html$)[/\w\.-]+$

Run Code Online (Sandbox Code Playgroud)

看到它在线工作:rubular

你用的是什么引擎？如果它是支持前瞻断言的那个,您可以执行以下操作:

/((?!\.html$)[/\w.-])+/

Run Code Online (Sandbox Code Playgroud)

如果我们将其分解为组件,它看起来像这样:

(            # start a group for the purposes of repeating
 (?!\.html$) # negative lookahead assertion for the pattern /\.html$/
 [/\w.-]     # your own pattern for matching a URL character
)+           # repeat the group

Run Code Online (Sandbox Code Playgroud)

这意味着,对于每个角色,它会在消耗角色之前测试模式/.html /在此处不匹配.

您可能还希望^在开始和$结束时锚定整个模式以强制它匹配整个URL - 否则它只能匹配URL的一部分.随着这种变化,它变成了

/^((?!\.html$)[/\w.-])+$/

Run Code Online (Sandbox Code Playgroud)

归档时间：	15 年前
查看次数：	27475 次
最近记录：	15 年前

正则表达式模式匹配字符串中至少1个数字和1个字符 43

Grepl在R期间？ 14

JavaScript按多次出现的字母拆分字符串 12

preg_match():编译失败:\ x {}或\ o {}中的字符值在第25行的偏移量27处太大 11

preg_replace密码过滤器 10

在Python中查找"-regex ..."或如何查找整个名称(路径+名称)与正则表达式匹配的文件？ 10

使用正则表达式过滤diff 10

突出显示周围文字的文字 8

通过特定标记将HTML字符串拆分为数组 7

正则表达式匹配网址没有文件扩展名 6

有一个CSS父选择器吗？ 2986

舍入到最多2位小数(仅在必要时) 2492

在GitHub上使用https://时有没有办法跳过密码输入？ 1806

按值复制数组 1638

什么是TypeScript,为什么我会用它代替JavaScript？ 1637

你什么时候使用git rebase而不是git merge？ 1461

将图像加载到Bitmap对象时出现奇怪的内存不足问题 1252

如何分析Python脚本？ 1203

如何撤消'git reset'？ 1172

如何使用jQuery按名称选择元素？ 1160