使用REGEX匹配所有三种PHP注释

gre*_*uan 3 php regex comments sublimetext2

我是REGEX的新手,我需要一些帮助.

我需要匹配PHP可能具有的所有三种类型的注释:
# Single line comment
// Single line comment
/* Multi-line comments */

/**
 * And all of it's possible variations
 */
Run Code Online (Sandbox Code Playgroud)

我应该提到的一点,我这样做是为了能够识别PHP结束标记(?>)是否在注释内,如果是,则忽略它,如果不是,则将其计为一个.这将被用在XML文档中,以便改进Sublime Text对结束标记的识别(因为它让我疯了!).我试图在几个小时内实现这个目标,但却无法实现,所以如果你能翻译它以使用XML我会很感激.:)

因此,如果您还可以包含if-then-else登录,我将非常感激.顺便说一句,我真的需要它是纯粹的REGEX表达,没有语言功能或任何东西.:)

就像Eicon提醒我一样,我需要所有这些能够在行的开头或一段代码的末尾匹配,所以我还需要以下所有代码:

<?php
echo 'something'; # this is a comment
?>
Run Code Online (Sandbox Code Playgroud)

任何帮助,将不胜感激.:)

Mar*_*der 9

解析编程语言对于正则表达式来说似乎太过分了.您可能应该寻找PHP解析器.

但这些将是你正在寻找的正则表达式.我假设你们所有人都使用了DOTALL或SINGLELINE选项(尽管前两个选项在没有它的情况下也能正常工作):

~#[^\r\n]*~
~//[^\r\n]*~
~/\*.*?\*/~s
Run Code Online (Sandbox Code Playgroud)

请注意,如果注释分隔字符出现在字符串中或其他地方,它们实际上不会打开注释,则任何这些都会导致问题.

您还可以将所有这些组合成一个正则表达式:

~(?:#|//)[^\r\n]*|/\*.*?\*/~s
Run Code Online (Sandbox Code Playgroud)

如果您使用某些不需要分隔符的工具或语言(如Java或C#),请删除它们~.在这种情况下,您还必须以不同方式应用DOTALL选项.但不知道你将在何处使用它,我无法告诉你如何.

如果您不能/不想设置DOTALL选项,这将是等效的(我也省略了分隔符来举例):

(?:#|//)[^\r\n]*|/\*[\s\S]*?\*/
Run Code Online (Sandbox Code Playgroud)

请看这里的工作演示.

现在,如果您还想捕获组中注释的内容,那么您可以执行此操作

(?|(?:#|//)([^\r\n]*)|/\*([\s\S]*?)\*/)
Run Code Online (Sandbox Code Playgroud)

无论注释的类型如何,注释内容(没有语法分隔符)都将在捕获1中找到.

另一个工作演示.