每个领域的不同分析仪

Question

每个领域的不同分析仪

如何为我正在使用Lucene编制索引的文档中的每个字段启用不同的分析器？例:

        RAMDirectory dir = new RAMDirectory();
        IndexWriter iw = new IndexWriter(dir, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_CURRENT), true, IndexWriter.MaxFieldLength.UNLIMITED);
        Document doc = new Document();
        Field field1 = new Field("field1", someText1, Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS);
        Field field2 = new Field("field2", someText2, Field.Store.YES, Field.Index.ANALYZED, Field.TermVector.WITH_POSITIONS_OFFSETS);
        doc.Add(field1);
        doc.Add(field2);
        iw.AddDocument(doc);
        iw.Commit();

Run Code Online (Sandbox Code Playgroud)

分析器是IndexWriter的参数,但是我想将fieldAnalyzer用于field1,将SimpleAnalyzer用于field2,我该怎么做？当然,搜索时同样适用.必须为每个字段应用正确的分析仪.

Answer 1

Sha*_*ore 27

PerFieldAnalyzerWrapper正是您所需要的.在Lucene.net中相当于此.

Answer 2

use*_*849 9

Map<String, Analyzer> analyzerMap = new HashMap<String, Analyzer>();
analyzerMap.put(fieldone, new IKAnalyzer4PinYin(false, IKAnalyzer4PinYin.PINYIN));
analyzerMap.put(fieldtwo, new IKAnalyzer4PinYin(false, KAnalyzer4PinYin.PINYIN_SHOUZIMU));
PerFieldAnalyzerWrapper wrapper = new PerFieldAnalyzerWrapper(new IKAnalyzer4PinYin(false), analyzerMap);

IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_40 , wrapper);

Run Code Online (Sandbox Code Playgroud)

归档时间：	16 年，1 月前
查看次数：	6176 次
最近记录：	12 年，8 月前