用于自然语言处理的Python与Java

CTs*_*rth 5 python java text nlp similarity

我一直在研究java以找到两个文档之间的相似性.我更喜欢找到语义相似性,但还没有努力找到它.我使用以下方法.

  1. 提取术语/令牌(我使用带有wordnet的JAWS来删除同义词,从而改善相似性)
  2. 制作一个术语文档矩阵
  3. LSA
  4. 余弦相似度

当我查看几个stackoverflow页面时,我得到了一些python实现的链接.

我想知道python是否是一种更好的语言来查找文本相似性,并且还想知道我是否可以在python中找到两个文档之间的语义相似

iro*_*hon 2

假设你没有平台限制来限制你选择的语言,你应该根据你最喜欢的语言(我自己更喜欢Python)来选择你的语言,并且它有最适合你的应用程序的库(如@ GregHewgill指出Python工具(Natural Language Toolkit)是成熟且全面的)。

因此,虽然我个人会选择 Python,但这确实是你必须为自己选择的东西。

==编辑==

这个关于 Java NLP 库的问题可能会帮助您决定是否可以使用 Java 进行分析;最上面的答案有一个您可以调查的列表。如果没有有关您的问题集的更多信息,我无法提供更具体的建议。