计算文本之间相似性的算法

7 java text nlp artificial-intelligence mining

我试图在社交网络的帖子之间得分相似,但没有找到任何好的算法,思想?

我刚刚尝试过Levenshtein,JaroWinkler和其他人,但是那些人更习惯于比较没有情感的文本.在帖子中我们可以得到一个文字说"我真的喜欢狗"和另一个说"我真的很喜欢狗",我们需要将这个案例归类为完全不同.

谢谢

Pie*_*din 1

您可能需要查看意见挖掘和情绪分析,以了解任务的复杂性。

简短的回答:没有“好的算法”,只有平庸的算法。这是一个非常困难的问题。祝你好运。