它包括一个名为org.tartarus.snowball.ext.italianStemmerextends 的类SnowballStemmer.
要使用,SnowballStemmer请查看动词attaccare现在时的以下测试代码:
import org.junit.Test;
import org.tartarus.snowball.SnowballStemmer;
import org.tartarus.snowball.ext.italianStemmer;
public class SnowballItalianStemmerTest {
@Test
public void testSnowballItalianStemmerAttaccare() {
SnowballStemmer stemmer = (SnowballStemmer) new italianStemmer();
String[] tokens = "attacco attacchi attacca attacchiamo attaccate attaccano".split(" ");
for (String string : tokens) {
stemmer.setCurrent(string);
stemmer.stem();
String stemmed = stemmer.getCurrent();
Assert.assertEquals("attacc", stemmed);
System.out.println(stemmed);
}
}
}
Run Code Online (Sandbox Code Playgroud)
输出:
attacc
attacc
attacc
attacc
attacc
attacc
Run Code Online (Sandbox Code Playgroud)
对于另一个使用示例,请参阅TestApp.java相同的tgz文件.
Lucene是用Java编写的,它使用Snowball进行词干化,例如作为SnowballFilter中的过滤器.
| 归档时间: |
|
| 查看次数: |
1939 次 |
| 最近记录: |