roh*_*hit 1 text classification machine-learning
我有一份药物名称列表(crocin,seroflo,oxitab等).清单很长.现在假设我需要找到一个特定的药物是否存在未在列表中,但也有可能是错字errors.supposing我打算找藏花素在列表中,但我不是键入crosin.I想要的机器学习算法来克服我的这个印刷错误以及像crocin和crosin这样的小差异,它应该在匹配时返回
我不认为你需要机器学习一个简单的编辑距离算法应该这样做.
https://en.wikipedia.org/wiki/Edit_distance