将一个输入文件与给定数量的文件匹配的算法

dev*_*sda 7 c c++ string algorithm string-matching

我上周接受了一次采访.我被困在算法回合中的一个问题中.我回答了这个问题,但面试官似乎并不相信.这就是我分享同样的原因.

请告诉我这个问题的任何优化方法,以便在将来的采访中帮助我.

问题: -

给出了20个文本文件,所有文件都是ASCII文本文件,大小小于10 ^ 9字节.还有一个输入,这也是一个ASCII文件,比如input.txt.

我们的任务是战略性地将此输入文件的内容与给定的20个文件匹配,并打印最接近的匹配文件的名称.输入文件的内容可能只是部分匹配

提前致谢.寻找你的回复.

bob*_*bah 3

区分它们并通过 wc -l,或在 C++ 中实现Levenshtein 距离,将每一行视为单个字符(或考虑主题域的任何更合适的单位)

  • +1,非常好的答案,但是,使用编辑距离算法有点难以实现(在我看来)。 (2认同)
  • @anonymous:在没有建设性意见的情况下投反对票 - 不好 (2认同)