我使用lucene雪球分析仪进行干预.结果不是有意义的话.我提到了这个问题.
其中一个解决方案是使用一个数据库,该数据库包含单词的词干版本与单词的一个稳定版本之间的映射.(无论社区的基础是什么(社区/或其他一些词),从社区到社区的例子)
我想知道是否有一个执行这样功能的数据库.
我最近一直致力于潜在的语义分析.我已经使用Jama包在java中实现了它.
这是代码:
Matrix vtranspose ;
a = new Matrix(termdoc);
termdoc = a.getArray();
a = a.transpose() ;
SingularValueDecomposition sv =new SingularValueDecomposition(a) ;
u = sv.getU();
v = sv.getV();
s = sv.getS();
vtranspose = v.transpose() ; // we obtain this as a result of svd
uarray = u.getArray();
sarray = s.getArray();
varray = vtranspose.getArray();
if(semantics.maketerms.nodoc>50)
{
sarray_mod = new double[50][50];
uarray_mod = new double[uarray.length][50];
varray_mod = new double[50][varray.length];
move(sarray,50,50,sarray_mod);
move(uarray,uarray.length,50,uarray_mod);
move(varray,50,varray.length,varray_mod);
e = new Matrix(uarray_mod);
f = new Matrix(sarray_mod);
g = new …Run Code Online (Sandbox Code Playgroud) 我一直在研究java以找到两个文档之间的相似性.我更喜欢找到语义相似性,但还没有努力找到它.我使用以下方法.
当我查看几个stackoverflow页面时,我得到了一些python实现的链接.
我想知道python是否是一种更好的语言来查找文本相似性,并且还想知道我是否可以在python中找到两个文档之间的语义相似
我下载了stanford nlp,当我运行他们网站上给出的代码时.
我在这一行中收到错误:
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
Run Code Online (Sandbox Code Playgroud)
错误如下:
Exception in thread "main" java.lang.NoClassDefFoundError: nu/xom/Node
at sample1.main(sample1.java:35)
Caused by: java.lang.ClassNotFoundException: nu.xom.Node
at java.net.URLClassLoader$1.run(Unknown Source)
at java.net.URLClassLoader$1.run(Unknown Source)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
at java.lang.ClassLoader.loadClass(Unknown Source)
... 1 more
Run Code Online (Sandbox Code Playgroud)
我使用eclipse,我应该做一些配置吗?请帮帮我!
java ×4
similarity ×2
lsa ×1
nlp ×1
python ×1
stanford-nlp ×1
stemming ×1
svd ×1
text ×1
theory ×1