小编CTs*_*rth的帖子

阻止的逆过程

我使用lucene雪球分析仪进行干预.结果不是有意义的话.我提到了这个问题.

其中一个解决方案是使用一个数据库,该数据库包含单词的词干版本与单词的一个稳定版本之间的映射.(无论社区的基础是什么(社区/或其他一些词),从社区到社区的例子)

我想知道是否有一个执行这样功能的数据库.

java similarity stemming porter-stemmer

8
推荐指数
1
解决办法
4377
查看次数

我们如何确定Latent语义分析的维数?

我最近一直致力于潜在的语义分析.我已经使用Jama包在java中实现了它.

这是代码:

    Matrix vtranspose ; 
    a = new Matrix(termdoc);  
    termdoc = a.getArray(); 
    a = a.transpose() ; 
    SingularValueDecomposition sv =new SingularValueDecomposition(a) ; 
    u = sv.getU();
    v = sv.getV(); 
    s = sv.getS();
    vtranspose = v.transpose() ; // we obtain this as a result of svd 

    uarray = u.getArray();
    sarray = s.getArray(); 
    varray = vtranspose.getArray(); 
    if(semantics.maketerms.nodoc>50)
    {

        sarray_mod = new double[50][50]; 
        uarray_mod = new double[uarray.length][50];
        varray_mod = new double[50][varray.length]; 
        move(sarray,50,50,sarray_mod); 
        move(uarray,uarray.length,50,uarray_mod); 
        move(varray,50,varray.length,varray_mod); 
        e = new Matrix(uarray_mod); 
        f = new Matrix(sarray_mod);
        g = new …
Run Code Online (Sandbox Code Playgroud)

java theory svd lsa latent-semantic-indexing

8
推荐指数
1
解决办法
5009
查看次数

用于自然语言处理的Python与Java

我一直在研究java以找到两个文档之间的相似性.我更喜欢找到语义相似性,但还没有努力找到它.我使用以下方法.

  1. 提取术语/令牌(我使用带有wordnet的JAWS来删除同义词,从而改善相似性)
  2. 制作一个术语文档矩阵
  3. LSA
  4. 余弦相似度

当我查看几个stackoverflow页面时,我得到了一些python实现的链接.

我想知道python是否是一种更好的语言来查找文本相似性,并且还想知道我是否可以在python中找到两个文档之间的语义相似

python java text nlp similarity

5
推荐指数
1
解决办法
2684
查看次数

stanford nlp核心出错

我下载了stanford nlp,当我运行他们网站上给出的代码时.

我在这一行中收到错误:

     StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
Run Code Online (Sandbox Code Playgroud)

错误如下:

     Exception in thread "main" java.lang.NoClassDefFoundError: nu/xom/Node
    at sample1.main(sample1.java:35)
    Caused by: java.lang.ClassNotFoundException: nu.xom.Node
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.net.URLClassLoader$1.run(Unknown Source)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    at sun.misc.Launcher$AppClassLoader.loadClass(Unknown Source)
    at java.lang.ClassLoader.loadClass(Unknown Source)
    ... 1 more
Run Code Online (Sandbox Code Playgroud)

我使用eclipse,我应该做一些配置吗?请帮帮我!

java stanford-nlp

5
推荐指数
1
解决办法
8117
查看次数