Mik*_*kos 10
您需要创建所谓的倒排索引 - 这是搜索引擎工作方式的核心(谷歌).Apache Lucene可以说是倒排索引的最佳库.你有2个选择:
Lucene.net - Java Lucene库的.NET端口.
Apache Solr - 一个使用Lucene库构建的完整搜索服务器,可以轻松集成到.NET应用程序中,因为它具有RESTful API.具有多种功能,如缓存,缩放,拼写检查等,开箱即用.您可以使用优秀的SolrNet库让您的app-to-Solr交互更轻松.
Apache Tika提供了一个非常广泛的数据/元数据提取工具包,可以处理PDF,HTML,MS Office文档等.一个更简单的选择是IFilter API.有关详细信息,请参阅此文章.
| 归档时间: |
|
| 查看次数: |
4601 次 |
| 最近记录: |