正则表达式匹配两个或多个连续字符

Raa*_*esh 2 .net c# regex

使用正则表达式我想匹配一个单词

  • 以字母开头
  • 有英文字母
  • 数字、句点(.)、连字符(-)、下划线(_)
  • 不应有两个或多个连续句点或连字符或下划线
  • 可以有多个句点或连字符或下划线

例如,

flin..stones 或 flin__stones 或 flin--stones

不允许。

fl_i_stones 或 fli_st.ones 或 flin.stones 或 flinstones

被允许 。

到目前为止,我的正则表达式是^[a-zA-Z][a-zA-Z\d._-]+$

所以我的问题是如何使用正则表达式

Mar*_*der 5

您可以使用前瞻反向引用来解决这个问题。但请注意,现在您至少需要 2 个字符。起始字母和另一个(由于+)。你可能想使这+*使第二字符类可以重复0次或更多次:

^(?!.*(.)\1)[a-zA-Z][a-zA-Z\d._-]*$
Run Code Online (Sandbox Code Playgroud)

前瞻是如何工作的?首先,这是一个负面的前瞻。如果内部模式找到匹配项,则前瞻会导致整个模式失败,反之亦然。所以如果我们确实有两个连续的字符,我们可以在里面有一个匹配的模式。首先,我们在字符串 ( .*) 中查找任意位置,然后匹配单个(任意)字符 ( .) 并用括号捕获它。因此,那个角色进入了捕获组1。然后我们要求这个捕获组跟在它后面(用 引用它\1)。所以内部模式将尝试在字符串中的每个位置(由于回溯) 是否有跟在其后的字符。如果找到这两个连续字符,则模式将失败。如果找不到它们,引擎会跳回前瞻开始的位置(字符串的开头)并继续匹配实际模式。

或者,您可以将其拆分为两个单独的检查。有效字符和起始字母之一:

^[a-zA-Z][a-zA-Z\d._-]*$
Run Code Online (Sandbox Code Playgroud)

一个用于连续字符(您可以在其中反转匹配结果):

(.)\1
Run Code Online (Sandbox Code Playgroud)

这将大大提高代码的可读性(因为它不像前瞻那样晦涩),并且还允许您检测模式中的实际问题并返回适当且有用的错误消息。