Che*_*eso 3 perl words auto-generate phonetics
当你拼错谷歌中的一个单词时(例如"appples"),它会为你提供现在熟悉的"你的意思是:苹果 "的建议.
根据搜索结果的相关性排除Google猜测您的意图的能力,我如何开发一个听起来相同的单词列表?
这些词不一定是英语,也不一定存在.因此,举例来说,如果我给输入"漏洞",我会找回一个列表,其中包括:"整体","hola","妓女","角色","磨牙"等...
我猜可能有一些在线的东西可以开发这个列表,但我找不到任何东西.如果没有站点,并且可以使用Perl完成,是否有CPAN模块可以帮助我这样做?
小智 5
如果您真的在寻找听起来相同的单词,而不仅仅是搜索建议 - 您可以查看语音算法.Soundex和Metaphone/Double Metaphone是两个非常常见的,并且每个都有任何流行语言的实现.
这些算法将单词缩减为指示其发音的"键".如果您开始使用单词语料库并构建一个数据结构,将这些键映射到评估它们的单词 - 您可以使用任意字符串,将其评估为其"键",然后查找评估为相同的其他单词键入您的数据结构(可能是列表或类似的哈希表).
这并不完美,因为您需要找到一个大的单词集来为您的数据集播种,但它会起作用.
另一方面,如果您只是想要搜索建议/替代拼写,那么有更简单的方法可以解决它.
希望这很有帮助.