如何测量两个字符串序列之间的相似性百分比?
我有两个文本文件和In文件,序列写得像
第一档:
AAA BBB DDD CCC GGG MMM AAA MMM
第二档:
BBB DDD CCC MMM AAA MMM
如何根据字符串的顺序来衡量这两个文件之间的相似性?
例如,在上面的示例中,由于字符串的顺序相同,两个文件都具有相似性,但是文件-2中缺少某些字符串.什么算法最适合解决这个问题,以便我可以测量字符串的顺序与两个字符串的频率有多相似?
sequences
sequences ×1