有谁知道从文本正文中仅提取名词的最简单方法?
我听说过TreeTagger工具,我试过试一试,但由于某些原因无法让它工作.
有什么建议?
谢谢菲尔
编辑:
import org.annolab.tt4j.*;
TreeTaggerWrapper tt = new TreeTaggerWrapper();
try { tt.setModel("/Nouns/english.par");
tt.setHandler(new TokenHandler() {
void token(String token, String pos, String lemma) {
System.out.println(token+"\t"+pos+"\t"+lemma); } });
tt.process(words); // words = list of words
} finally { tt.destroy();
}
那是我的代码,英语是语言.我收到错误:新类型TokenHandler(){}必须实现继承的抽象方法TokenHandler.token.难道我做错了什么?