我应该了解Python以识别不同源文件中的注释?

Can*_*ell 1 python text-manipulation

我需要在给定目录中的不同类型的源文件中识别注释.(例如java,XML,JavaScript,bash).我决定使用Python(尝试学习Python)来做到这一点.我的问题是

1)我应该怎么知道python才能完成这项工作?(我有一个想法,正则表达式将是有用的,但有替代/其他模块将有用吗?我可以用来完成这项工作的库吗?)

2)Python是否是完成此类任务的不错选择?其他语言是否会使这更容易实现?

C2H*_*5OH 5

您的问题似乎与编程语言解析更相关.我相信使用正则表达式,您将能够在大多数语言中找到评论.好处是你几乎到处都有正则表达式:Perl,Python,Ruby,AWK,Sed等.

但是,正如另一个答案所说,你最好使用一些解析机制.而且,如果不是一个完整的解析器,一个词法分析器.对于Python,请查看Pygments库,该库具有已实现的许多语言的词法分析器.