jcv*_*dan 9 c# full-text-search entity-framework
我需要搜索一个可能很大的句子集合,我不知道从哪里开始.
总之,用户将提交搜索短语,例如"如何删除我的帐户",然后我需要转到数据库并与提供的单词匹配.
目前我正在考虑做以下事情:
有人能指出我正确的方向吗?此外,如果有人知道任何图书馆做这种工作将是伟大的.
干杯
至于单词的优先级,简单但非常有效的解决方案是根据它们的受欢迎程度对它们进行排序(也许可以根据数据库中的文章创建流行度指数),这样在文本中很少见的单词更重要,这样你就可以提升不那么一般的话.
这里的另一个问题是,你可能会有不同形式的单词,比如过去/将来时,因此你可能会对它们产生兴趣,一个移植到c#的工具就是我记得的Snowball项目.
至于你的问题的第二部分,循环使用单词可能是非常无效的,我认为你应该考虑使用一些索引库/解决方案.一个,流行的.net是Lucene.Net.它基本上创建了反向索引,它将某些短语(如单词)映射到包含它们的文章,这使您可以快速查找文本中所有出现的给定单词.您可以在数据库中自己实现类似的方法
归档时间: |
|
查看次数: |
3740 次 |
最近记录: |