我发现gensim有BM25排名功能.但是,我找不到教程如何使用它.
就我而言,我有一个查询.从搜索引擎中检索到的一些文档.如何使用gensim BM 25排名来比较查询和文档,找到最相似的一个?
我是gensim的新手.谢谢.
查询:
"experimental studies of creep buckling ."
Run Code Online (Sandbox Code Playgroud)
文件1:
" the 7 x 7 in . hypersonic wind tunnel at rae farnborough, part 1, design, instrumentation and flow visualization techniques . this is the first of three parts of the calibration report on the r.a.e. some details of the design and lay-out of the plant are given, together with the calculated performance figures, and the major components of the facility are briefly described . the instrumentation …Run Code Online (Sandbox Code Playgroud) 我有关于如何评估信息检索结果是否良好的问题,如计算
相关文件排名,召回,精确度,AP,MAP .....
目前,一旦用户输入查询,系统就能够从数据库中检索文档.问题是我不知道如何进行评估.
我得到了一些公共数据集,例如 它包含的"Cranfield collection" 数据集链接
1.document 2.query 3.relevance asments
DOCS QRYS SIZE*
Cranfield 1,400 225 1.6
Run Code Online (Sandbox Code Playgroud)
我可以通过使用"Cranfield collection"来计算相关的文档排名,召回率,精度,AP,MAP .....
我可能需要一些想法和方向.不要求如何编写程序代码.