我有一个名称文件,我想在其中进行搜索,而不是太在意我是否正确拼写了名称(我正在搜索的名称)。我知道它grep
有相当多的功能可以在文件或流中搜索大量类似的字符串,但据我所知,它没有纠正拼写错误的功能,即使有,因为这些是人名,在标准字典中找不到。
也许我可以把我的名字文件做成一个特殊的字典,然后使用一些标准的拼写检查工具?在这个应用程序中特别重要的是匹配发音相似的单词的能力。
例如:"jacob"
应该返回"Jakob"
。如果语言间的相似性也被考虑在内,那就更好了,这样"miguel"
应该匹配"Michael"
。
这是已经实施的东西,还是我必须自己构建?