Can*_*ell 1 python text-manipulation
我需要在给定目录中的不同类型的源文件中识别注释.(例如java,XML,JavaScript,bash).我决定使用Python(尝试学习Python)来做到这一点.我的问题是
1)我应该怎么知道python才能完成这项工作?(我有一个想法,正则表达式将是有用的,但有替代/其他模块将有用吗?我可以用来完成这项工作的库吗?)
2)Python是否是完成此类任务的不错选择?其他语言是否会使这更容易实现?
C2H*_*5OH 5
您的问题似乎与编程语言解析更相关.我相信使用正则表达式,您将能够在大多数语言中找到评论.好处是你几乎到处都有正则表达式:Perl,Python,Ruby,AWK,Sed等.
但是,正如另一个答案所说,你最好使用一些解析机制.而且,如果不是一个完整的解析器,一个词法分析器.对于Python,请查看Pygments库,该库具有已实现的许多语言的词法分析器.
归档时间:
13 年,10 月 前
查看次数:
97 次
最近记录: