我几乎是数据挖掘和推荐系统的新手,现在正试图为具有这些参数的用户构建某种rec系统:
为了计算它们之间的相似性,我将应用余弦相似性和离散相似性.例如:
1 0 0 1 0 0 ... n
1 1 1 0 1 0 ... n
Run Code Online (Sandbox Code Playgroud)
这1意味着利益的存在,并且n是所有利益的总数.
我的问题是:如何以适当的顺序组合这三个相似之处?我的意思是只是总结它们听起来不太聪明,是吗?我也想听听关于我的"新手相似系统"的评论,哈.
有类似删除我的架构的问题
/**
* Article Schema
*/
var Comments = new Schema({
body: { type : String, default : '' },
user: { type : Schema.ObjectId, ref : 'User' },
createdAt: { type : Date, default : Date.now }
})
var Likes = new Schema({
user: { type : Schema.ObjectId, ref : 'User' },
createdAt: { type : Date, default : Date.now }
})
var ArticleSchema = new Schema({
title: {type : String, default : '', trim : true},
body: {type …Run Code Online (Sandbox Code Playgroud)