两个文本文件之间的百分比差异

Moh*_*med 14 python language-agnostic linux algorithm

我知道我可以使用cmp,diff等来比较两个文件,但我要找的是一个实用程序,它给出了两个文件之间的百分比差异.

如果没有这样的效用,任何算法都会做得很好.我读过有关模糊编程的内容,但我还不太了解它.

Nad*_*mli 33

您可以使用difflib.SequenceMatcher 比率方法

从文档:

将序列相似性的度量返回为[0,1]范围内的浮点数.

例如:

from difflib import SequenceMatcher
text1 = open(file1).read()
text2 = open(file2).read()
m = SequenceMatcher(None, text1, text2)
m.ratio()
Run Code Online (Sandbox Code Playgroud)