机器学习中的逐点和成对排名有什么区别

Question

我一直在读关于成对排名的论文,这是我没有得到的:

逐点和成对排名之间的训练/测试数据有何不同？这是我一直在阅读的论文:http: //www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf

在那里,它表示pairwaise排名中的数据点是两个链接之间的不平等:

[line].=.[两个链接之间的不等,即目标] qid:[qid] [[链接1和2的特征]:[值1和2]]#[info]

但是,RankLib确实支持像RankNet和RankBoost这样的成对调度器,但它使用它的数据点格式是逐点的

[line].=.[绝对排名,即目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ...#[info]

有什么我想念的吗？

Answer 1

逐点排名类似于回归.每个点都有一个相关的排名分数,您希望预测该排名分数.因此,您的标记数据集将具有特征向量和给定查询的相关排名分数

IE:{d1,r1} {d2,r2} {d3,r3} {d4,r4}

其中r1> r2> r3> r4

成对排名类似于分类.每个数据点与另一个数据点相关联,并且目标是学习分类器,该分类器将预测两者中的哪一个与给定查询"更"相关.

IE:{d1> d2} {d2> d3} {d3> d4}