我正在尝试使用Apache Lucene进行标记,我对从一个获取令牌的过程感到困惑TokenStream.
最糟糕的是,我正在查看解决我的问题的JavaDocs中的注释.
不知何故,AttributeSource应该使用an 而不是Tokens.我完全不知所措.
任何人都可以解释如何从TokenStream获取类似令牌的信息吗?
有没有一种简单的方法可以使用Lucene的任何子类Analyzer来解析/标记化String?
就像是:
String to_be_parsed = "car window seven";
Analyzer analyzer = new StandardAnalyzer(...);
List<String> tokenized_string = analyzer.analyze(to_be_parsed);
Run Code Online (Sandbox Code Playgroud)