跨不同工具集的 Intranet 搜索引擎有哪些工具?

Jun*_*awa 5 search intranet search-engine

基本要求:

  • 应该能够索引 MediaWiki、Confluence、Sharepoint、GitHub:Enterprise、Askbot 等内容
  • 对于重复数据删除结果应该相当聪明(Confluence 搜索如此痛苦的原因之一)。
  • 绝对应该结合启发式方法,例如有多少页面链接到文档、搜索词是否在文档标题中等等。如果用户有办法降低特定结果​​的排名,那可能是一个好处。
  • 应该有所调整(例如,更喜欢 Confluence 而不是 Sharepoint,将某些路径列入黑名单)。

有没有现成的产品可以做到以上几点?自由软件项目?是否有 FOSS 项目可以提供上述基础知识并且易于扩展或构建前端?

Raú*_*rez 4

您可以尝试Apache Solr,它是一个很棒的工具。

据网站称:

Solr 是来自 Apache Lucene 项目的流行、速度极快的开源企业搜索平台。其主要功能包括强大的全文搜索、命中突出显示、分面搜索、近实时索引、动态集群、数据库集成、丰富文档(例如Word、PDF)处理和地理空间搜索。Solr 具有高度可靠性、可扩展性和容错性,提供分布式索引、复制和负载平衡查询、自动故障转移和恢复、集中配置等。Solr 为许多世界上最大的互联网站点的搜索和导航功能提供支持。