小编Cod*_*rus的帖子

如何计算查询的TF-IDF?

如何计算tf-idf查询?我理解如何使用以下定义计算一组文档的tf-idf:

tf =文档中的出现/文档中的总词数

idf = log(#documents/#documents,其中包含术语

但我不明白这与查询有何关联.

例如,我读了一个资源,说明了查询的值" life learning"

生活| tf = .5 | idf = 1.405507153 | tf_idf = 0.702753576
学习| tf = .5 | idf = 1.405507153 | tf_idf = 0.702753576

tf我理解的值,每个术语只出现在两个可能的术语中,因此1/2,但我不知道idf它来自何处.
我认为#documents = 1和occurrence = 1,log(1)= 0,所以idf将是0,但似乎并非如此.它是基于您使用的任何文件?你如何计算查询的tf-idf?

search computer-science data-retrieval tf-idf

9
推荐指数
2
解决办法
6559
查看次数

标签 统计

computer-science ×1

data-retrieval ×1

search ×1

tf-idf ×1