我对计算AUC(曲线下的面积)以评估推荐系统结果感到困惑。
如果我们有交叉验证数据,例如(用户,产品,等级)。如何为每个用户选择正样本和负样本来计算AUC?
选择在数据集中为每个用户出现的产品作为正样本,而在数据集中没有出现其余的作为负样本,是否很好?我认为这种方法无法找出那些“真实”的负样本,因为用户有机会喜欢这些在负样本中的产品。
machine-learning data-science
data-science ×1
machine-learning ×1