训练没有历史数据的神经网络

utx*_*eee 0 recommendation-engine neural-network no-data recommender-systems

我正在从头开始构建一个高度个性化的推荐系统,我没有用户和项目之间交互的历史数据.然而,添加到系统中的用户必须提供项目的标签列表:

  1. 他真的很喜欢;
  2. 他没有意见;
  3. 他不喜欢

然后,基于这些标签,我能够匹配组1,2和3的一些项目.

因此,我正在考虑从组1,2和3中对项目进行采样,并分别为它们分配目标值1,0和-1,以便训练我的神经网络.在训练步骤之后,我将获得针对每个用户高度个性化的神经网络,这将允许我开始推荐一些匹配每个用户的偏好的项目,尽管没有历史数据.

当然,当用户开始为推荐项目提供反馈时,我会更新网络以匹配他的新偏好.

话虽如此,这种方法是否有意义或神经网络不适合这种特定情况?

isp*_*zax 5

首先,你没有清楚地解释你的具体问题或问题,这通常会产生你可能没想到的答案,但我会尝试提供一些有意义的信息,而不是简单的42.

您没有指定,您希望推荐系统实现的是什么.现在根据您计划向用户提供建议的具体内容尚不清楚.这是用户A偏好与应该建议产品的所有其他用户偏好之间的相关性,用户A看不到他可能喜欢的吗?

根据描述,这似乎是最可能的情况.因此,您正在寻找通常称为协同过滤Netflix挑战的某种解决方案.您所描述的模型比Netflix或亚马逊拥有的数据简单得多,但它仍然无法在没有任何数据的情况下运行,因此初步猜测将完全关闭并惹恼用户.我的一个朋友经常被其他喜欢这部电影的人的建议所困扰 - 尽管Netflix拥有大量的数据和全面的推荐引擎,但他说这总是错的.因此,期待很多挫折甚至可能是故意破坏(因为用户故意提供错误的反馈,因为推荐质量差).避免它的唯一方法是首先通过询问反馈来收集数据,并在收集到足够数量的样本后才给出建议.

我们正在慢慢探讨如下所述的实际问题:如果神经网络是一个很好的工具.如果您有足够数量的数据可以适合您描述的简单模型,并且有少量误报(推荐不佳)和大量真阳性(正确建议),那就是.您需要多少数据取决于产品的数量和被喜欢和不喜欢的相关程度.如果你有2个产品没有相关性,无论你收集多少数据都没有好处.如果您将所有产品组合在一起非常相似,那么相关性将会很强,但在所有产品之间会相同,所以在您收集大量数据之前,您将无法提供任何有用的建议.一些不良品.最好的情况是一种高度相关但非常不同的产品(类似高端山地自行车和专业摄像头).这些应该根据其他用户偏好可靠地链接.

因此,如果没有进一步的信息,您将无法获得更多有用 您所描述的内容,如果空白填写得有点正确有意义,但它是否有效以及您需要多少数据将真正取决于所涉及的产品和用户的具体情况.

我希望它有所帮助.