我有一大堆单词(大约10,000),我需要找到这些单词中是否出现任何单词.
有没有比对文本块中的每个单词进行简单文本搜索更快的算法?
我有一个包含 1,000,000 个字符串的排序列表,最大长度为 256,带有蛋白质名称。每个字符串都有一个关联的 ID。我还有另一个未排序的 4,000,000,000 个字符串列表,最大长度为 256 个,单词不在文章中,每个单词都有一个 ID。
我想找到蛋白质名称列表和文章单词列表之间的所有匹配项。我应该使用哪种算法?我应该使用一些预构建 API 吗?
如果算法可以在没有特殊硬件的普通 PC 上运行,那就太好了。
估计算法所需的时间会很好,但不是强制性的。
我在数据库中有数千个关键字(每个关键字中包含一个或多个单词)的有限列表.我想有效地找到哪些关键字在给定的输入文本中,而不必逐个测试每个关键字(全表扫描).允许匹配文本中的一些拼写错误的单词会更好但不是必需的.任何算法/文章建议来解决这个问题?