gka*_*thy
13
首先,我应该透露我是Lucidworks Fusion的产品经理.
您似乎已经意识到Fusion使用Solr(或一个或多个Solr集群或实例),使用Solr进行数据存储和查询.Fusion的目的是使Solr更容易使用,集成Solr,并构建使用Solr的复杂解决方案.Fusion提供的一些许多人认为对此有帮助的事情包括:
- 连接器和连接器框架.Bare Solr为您提供了良好的API,并能够在命令行中推送某些类型的文件.Fusion附带了几个预构建的数据源连接器,可以从各种类型的系统中获取数据,并在适当时处理它们(包括解析,转换和字段映射),并将结果发送给Solr.这些连接器包括通用文档存储(云和内部部署),关系数据库,NoSQL数据存储,HDFS,企业应用程序以及功能强大且可配置的Web爬网程序.
- 安全集成.Solr没有任何身份验证或授权(虽然从本周的5.2版本开始,它确实有一个可插入的API和用于身份验证的Kerberos的基本实现).Fusion使用安全版本包装Solr API.Fusion具有与LDAP,Active Directory和Kerberos的完全集成,可用于身份验证.它还有一个细粒度的授权模型,用于管理和配置Fusion和Solr.并且,Fusion授权模型可以自动将来自LDAP/AD的组成员资格与来自Fusion Connectors数据源的访问控制列表相链接,以便在运行搜索查询时从源系统中镜像文档级访问控制.
- 管道处理模型.Fusion提供了具有模块化阶段(API和GUI形式)的管道模型,以便更轻松地定义和编辑数据和文档的转换.它类似于unix shell管道.例如,在编写索引时,您可以包括用于定义字段映射的阶段,计算新字段,聚合文档,从其他来源提取数据等,然后再写入Solr.查询时,您可以执行相同操作,同时转换查询,运行和返回其他分析的结果,以及应用安全筛选.
- 管理GUI.Fusion具有用于查看和配置上述内容的Web UI(以及基本Solr配置).我们认为这对于想要使用Solr的人来说很方便,但是不要经常使用它来记住如何使用API,配置文件和命令行工具.
- 基于搜索的复杂功能:使用上述管道模型,Fusion包含(并且易于使用)一些更丰富的基于搜索的组件,包括:自然语言处理和实体提取模块; 实时信号驱动的相关性调整.我们打算将来提供更多这些.
- 分析处理:Fusion包含并集成了Apache Spark,可以对存储在Solr中(或进入Solr的数据)运行深度分析.虽然Solr隐含地包含某些数据分析功能,但这不是其主要目的.我们使用Apache Spark来驱动Fusion的信号提取和相关性调优,并期望公开API,以便用户可以轻松地在那里运行其他处理.
- 其他:许多有用的杂项功能,如:仪表板UI; 具有手动相关性调整的基本搜索UI; 更容易监控; 工作管理和调度; 通过电子邮件集成实时提醒等等.
当然很多都可以在没有Fusion的情况下针对Solr构建或编写,但我们认为提供这些类型的企业集成对许多人来说都是有价值的.