使用Hibernate Search自动完成

Question

使用Hibernate Search自动完成

Rem*_* Ma 11 java mysql hibernate autocomplete hibernate-search

我正在尝试为我的网站构建更好的自动完成功能.我想使用Hibernate Search这个,但就我实验而言,它只能为我找到完整的单词.

所以,我的问题是:是否可以只搜索一些字符？

例如.用户输入3个字母并使用休眠搜索向他显示我的db对象的所有单词,其中包含这3个字母？

PS.现在我正在使用"喜欢"的查询...但我的数据库增长了很多,我还希望将搜索功能扩展到另一个表...

Answer 1

Tim*_*Tim 12

主要编辑 一年后,我能够改进我发布的原始代码以产生这个:

我的索引实体:

@Entity
@Indexed
@AnalyzerDef(name = "myanalyzer",
// Split input into tokens according to tokenizer
tokenizer = @TokenizerDef(factory = WhitespaceTokenizerFactory.class), //
filters = { //
// Normalize token text to lowercase, as the user is unlikely to care about casing when searching for matches
@TokenFilterDef(factory = LowerCaseFilterFactory.class),
// Index partial words starting at the front, so we can provide Autocomplete functionality
@TokenFilterDef(factory = NGramFilterFactory.class, params = { @Parameter(name = "maxGramSize", value = "1024") }),
// Close filters & Analyzerdef
})
@Analyzer(definition = "myanalyzer")
public class Compound extends DomainObject {
public static String[] getSearchFields(){...}
...
}

Run Code Online (Sandbox Code Playgroud)

所有@Fields都被标记化并存储在索引中; 这需要工作:
@Field(index = Index.TOKENIZED, store = Store.YES)

@Transactional(readOnly = true)
public synchronized List<String> getSuggestions(final String searchTerm) {
    // Compose query for term over all fields in Compound
    String lowerCasedSearchTerm = searchTerm.toLowerCase();

    // Create a fullTextSession for the sessionFactory.getCurrentSession()
    FullTextSession fullTextSession = Search.getFullTextSession(getSession());

    // New DSL based query composition
    SearchFactory searchFactory = fullTextSession.getSearchFactory();
    QueryBuilder buildQuery = searchFactory.buildQueryBuilder().forEntity(Compound.class).get();
    TermContext keyword = buildQuery.keyword();
    WildcardContext wildcard = keyword.wildcard();
    String[] searchfields = Compound.getSearchfields();
    TermMatchingContext onFields = wildcard.onField(searchfields[0]);
    for (int i = 1; i < searchfields.length; i++)
        onFields.andField(searchfields[i]);
    TermTermination matching = onFields.matching(input.toLowerCase());
    Query query = matching.createQuery();

    // Convert the Search Query into something that provides results: Specify Compound again to be future proof
    FullTextQuery fullTextQuery = fullTextSession.createFullTextQuery(query, Compound.class);
    fullTextQuery.setMaxResults(20);

    // Projection does not work on collections or maps which are indexed via @IndexedEmbedded
    List<String> projectedFields = new ArrayList<String>();
    projectedFields.add(ProjectionConstants.DOCUMENT);
    List<String> embeddedFields = new ArrayList<String>();
    for (String fieldName : searchfields)
        if (fieldName.contains("."))
            embeddedFields.add(fieldName);
        else
            projectedFields.add(fieldName);

    @SuppressWarnings("unchecked")
    List<Object[]> results = fullTextQuery.setProjection(projectedFields.toArray(new String[projectedFields.size()])).list();

    // Keep a list of suggestions retrieved by search over all fields
    List<String> suggestions = new ArrayList<String>();
    for (Object[] projectedObjects : results) {
        // Retrieve the search suggestions for the simple projected field values
        for (int i = 1; i < projectedObjects.length; i++) {
            String fieldValue = projectedObjects[i].toString();
            if (fieldValue.toLowerCase().contains(lowerCasedSearchTerm))
                suggestions.add(fieldValue);
        }

        // Extract the search suggestions for the embedded fields from the document
        Document document = (Document) projectedObjects[0];
        for (String fieldName : embeddedFields)
            for (Field field : document.getFields(fieldName))
                if (field.stringValue().toLowerCase().contains(lowerCasedSearchTerm))
                    suggestions.add(field.stringValue());
    }

    // Return the composed list of suggestions, which might be empty
    return suggestions;
}

Run Code Online (Sandbox Code Playgroud)

最后我正在做一些处理@IndexedEmbedded字段的争论.如果你没有这些,你可以简化代码,只是简单地投射searchFields,并省略文档和embeddedField处理.

和以前一样:希望这对下一个遇到这个问题的人有用.如果有人对上述代码有任何批评或改进,请随时编辑,请告诉我.

编辑3:此代码取自的项目自开源以来; 以下是相关课程:

https://trac.nbic.nl/metidb/browser/trunk/metidb/metidb-core/src/main/java/org/metidb/domain/Compound.java
https://trac.nbic.nl/metidb/browser /trunk/metidb/metidb-core/src/main/java/org/metidb/dao/CompoundDAOImpl.java
https://trac.nbic.nl/metidb/browser/trunk/metidb/metidb-search/src/main/的Java /组织/ metidb /搜索/文本/ Autocompleter.java

Answer 2

Tho*_*mas 7

你可以使用索引的字段NGramFilter的建议在这里.为了获得最佳结果,您应该使用Apache Solr中的EdgeNgramFilter,它从术语的起始边缘创建ngrams,也可以在hibernate搜索中使用.

归档时间：	14 年，10 月前
查看次数：	6468 次
最近记录：	12 年，9 月前