Git可以检测两个源文件是否基本上是彼此的副本?

lin*_*lof 7 c git plagiarism-detection

对不起,如果这是偏离主题,但这是你有机会减少本网站上的"家庭作业"问题:-)

我正在教授一门C编程课程,学生们在C中使用一个小型的数字例程库.今年,来自几组学生的源文件中有大量的代码重复.

(下到相同拼写错误的printf调试语句.我的意思是,你是多么愚蠢.)

我知道Git可以检测到两个源文件何时彼此相似超过某个阈值但是我从来没有经理让它来处理两个不在Git存储库中的源文件.

请记住,这些并不是特别复杂的学生.他们不太可能会遇到改变变量/函数名称的麻烦.

有没有办法可以使用Git来检测重要的文字代码重复,即抄袭?或者你可以推荐一些其他的工具

Man*_*rse 4

为什么要使用 git?一种简单但有效的技术是比较所有不同提交之间的差异大小,然后手动检查和比较差异最小的那些。