是否有Porter2 stemmer的java实现

bik*_*shg 11 java snowball porter-stemmer

你知道Porter2词干分析器的任何java实现(或者用java编写的更好的词干分析器)吗?我知道这里有一个java版本的Porter(不是Porter2):

http://tartarus.org/~martin/PorterStemmer/java.txt

但在http://tartarus.org/~martin/PorterStemmer/上,作者提到Porter有点过时,建议使用Porter2,可在

http://snowball.tartarus.org/algorithms/english/stemmer.html

然而,我的问题是这个Porter2是用雪球写的(我之前从未听说过,所以对此一无所知).我正在寻找的是它的java版本.

谢谢.非常感谢你的帮助.

Joe*_*oel 16

Snowball算法可以通过Java下载获得

来自snowball.tartarus.org:

2002年2月 - Java支持Richard修改了滚雪球代码生成器以生成Java输出以及ANSI C输出.这意味着纯Java系统现在可以使用雪球词干分析器.

这就是你想要的,对吧?

您可以像这样创建它的实例:

  Class stemClass = Class.forName("org.tartarus.snowball.ext." + lang + "Stemmer");
  stemmer = (SnowballProgram) stemClass.newInstance();
  stemmer.setCurrent("your_word");
  stemmer.stem();
  String your_stemmed_word = stemmer.getCurrent();  
Run Code Online (Sandbox Code Playgroud)