小编Vit*_*non的帖子

将数据集拆分为推荐系统上的训练集和测试集

我已经实现了一个基于矩阵分解技术的推荐系统。我想评价一下。

我想将 10 倍交叉验证与 All-but-one 协议一起使用(https://ai2-s2-pdfs.s3.amazonaws.com/0fcc/45600283abca12ea2f422e3fb2575f4c7fc0.pdf)。

我的数据集具有以下结构:

user_id,item_id,rating
1,1,2
1,2,5
1,3,0
2,1,5
...
Run Code Online (Sandbox Code Playgroud)

我很困惑如何分割数据,因为我无法在测试集中放入一些三元组(用户、项目、评级)。例如,如果我选择三元组 (2,1,5) 作为测试集,并且这是用户 2 做出的唯一评分,则不会有关于该用户的任何其他信息,并且训练后的模型不会预测任何对他的价值观。

考虑到这种情况,我应该如何进行拆分?

recommendation-engine machine-learning cross-validation

5
推荐指数
1
解决办法
4907
查看次数