Moh*_*med 14 python language-agnostic linux algorithm
我知道我可以使用cmp,diff等来比较两个文件,但我要找的是一个实用程序,它给出了两个文件之间的百分比差异.
如果没有这样的效用,任何算法都会做得很好.我读过有关模糊编程的内容,但我还不太了解它.
Nad*_*mli 33
您可以使用difflib.SequenceMatcher 比率方法
从文档:
将序列相似性的度量返回为[0,1]范围内的浮点数.
例如:
from difflib import SequenceMatcher
text1 = open(file1).read()
text2 = open(file2).read()
m = SequenceMatcher(None, text1, text2)
m.ratio()