bik*_*shg 11 java snowball porter-stemmer
你知道Porter2词干分析器的任何java实现(或者用java编写的更好的词干分析器)吗?我知道这里有一个java版本的Porter(不是Porter2):
http://tartarus.org/~martin/PorterStemmer/java.txt
但在http://tartarus.org/~martin/PorterStemmer/上,作者提到Porter有点过时,建议使用Porter2,可在
http://snowball.tartarus.org/algorithms/english/stemmer.html
然而,我的问题是这个Porter2是用雪球写的(我之前从未听说过,所以对此一无所知).我正在寻找的是它的java版本.
谢谢.非常感谢你的帮助.
Joe*_*oel 16
Snowball算法可以通过Java下载获得
2002年2月 - Java支持Richard修改了滚雪球代码生成器以生成Java输出以及ANSI C输出.这意味着纯Java系统现在可以使用雪球词干分析器.
这就是你想要的,对吧?
您可以像这样创建它的实例:
Class stemClass = Class.forName("org.tartarus.snowball.ext." + lang + "Stemmer");
stemmer = (SnowballProgram) stemClass.newInstance();
stemmer.setCurrent("your_word");
stemmer.stem();
String your_stemmed_word = stemmer.getCurrent();
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
13628 次 |
| 最近记录: |