小编dd9*_*90p的帖子

如何在python中使用gensim BM25排名

我发现gensim有BM25排名功能.但是,我找不到教程如何使用它.

就我而言,我有一个查询.从搜索引擎中检索到的一些文档.如何使用gensim BM 25排名来比较查询和文档,找到最相似的一个?

我是gensim的新手.谢谢.

查询:

"experimental studies of creep buckling ."
Run Code Online (Sandbox Code Playgroud)

文件1:

" the 7 x 7 in . hypersonic wind tunnel at rae farnborough, part 1, design, instrumentation and flow visualization techniques . this is the first of three parts of the calibration report on the r.a.e. some details of the design and lay-out of the plant are given, together with the calculated performance figures, and the major components of the facility are briefly described . the instrumentation …
Run Code Online (Sandbox Code Playgroud)

python ranking gensim

11
推荐指数
3
解决办法
9642
查看次数

关于如何衡量排名,AP,MAP,召回IR评估的一些想法和方向

我有关于如何评估信息检索结果是否良好的问题,如计算

相关文件排名,召回,精确度,AP,MAP .....

目前,一旦用户输入查询,系统就能够从数据库中检索文档.问题是我不知道如何进行评估.

我得到了一些公共数据集,例如 它包含的"Cranfield collection" 数据集链接

1.document 2.query 3.relevance asments

             DOCS   QRYS   SIZE*
Cranfield   1,400    225    1.6
Run Code Online (Sandbox Code Playgroud)

我可以通过使用"Cranfield collection"来计算相关的文档排名,召回率,精度,AP,MAP .....

我可能需要一些想法和方向.不要求如何编写程序代码.

evaluation information-retrieval information-extraction

1
推荐指数
1
解决办法
1532
查看次数