我有一大堆(XXM-XXXM)字符串看起来像(一个小样本):
我不知道所有可能的错误字符串,也不知道其排列.我想将所有类似的错误组合在一起,并生成一些统计信息,显示每个错误字符串组的错误计数.
所以,基本上,我想将最相似的字符串组合在一起,字符串可以属于多个组.
谢谢!
string
string ×1