我有一个代表大致相同的产品的清单.例如,在下面的列表中,它们都是希捷硬盘.
对于人类而言,硬盘驱动器3和5是相同的.我们可以更进一步,并假设产品1,3,4和5是相同的,并将产品2和6放在其他类别中.
我们有很多我想要分类的产品清单.有没有人知道做这种事情的最佳算法是什么.有什么建议?
我虽然使用贝叶斯分类器,但我不确定它是否是最佳选择.任何帮助,将不胜感激!
谢谢.
algorithm nlp
algorithm ×1
nlp ×1