Ste*_*han 5 automation plsql duplicates static-code-analysis
我正在分析一些旧代码。它大约是80.000行的旧plsql代码。乍看之下,源中有很多重复项需要删除。而是不用做diff的手册并查看每个文件,那里必须有一些工具/命令行配置来检测源代码的重复行。
我的目标是就源代码重写的最小规模以及该程序中捕获的实际知识量做出有根据的猜测。我写了一些基本的静态代码分析器来查找每个文件中的控制语句IF ELSE FOR等和函数。但是重复的代码仍然需要从我的统计信息中删除。
您看过Simian - 相似度分析器吗?(刚刚检查过,它不再免费,但可以使用 15 天进行评估。)
Simian(相似性分析器)可识别 Java、C#、C、C++、COBOL、Ruby、JSP、ASP、HTML、XML、Visual Basic、Groovy 源代码甚至纯文本文件中的重复。事实上,simian 可以用于任何人类可读的文件,例如 ini 文件、部署描述符等等。
我已经在实践中使用过并且效果很好。