Dan*_*ira 4 language-agnostic search heuristics
我有一个庞大的人名全名列表,我必须在一个巨大的文字中搜索.
只有部分名称可能出现在文本中.而且有可能被拼错,misstyped或简写为.文本没有令牌,因此我不知道文本中人名的起源.如果知道该名称是否会出现在文本中,我也不知道.
例:
我的名单中有"Barack Hussein Obama",因此我必须在以下文本中检查该名称的出现情况:
Certanily没有确定性的解决方案,但......
这种搜索有什么好的启发式方法?
如果你不得不,你会怎么做?