LightFM:权重和样本权重

RAb*_*ham 3 recommendation-engine

我希望深入了解 LightFM 实现以下方面的权重:

样本权重

  • 什么是sample_weightsfit方法?我读到它们是为了模拟时间衰减,但这究竟是如何工作的?解释这一点的示例或文章将非常有帮助。

交互矩阵

  • 现在,如果我与不同的content_types ie进行用户交互textvideo并且我们在提出建议时不想真正区分它们?
    • 我是否必须为每种媒体类型制作单独的模型?如果我创建一个模型,如果 for 的交互text是一个布尔值,如 1.0/0.0 的点击,如果交互video是 inpercentage_video_completed例如,如果用户看到 15 秒视频中的 10 秒,我可以分配权重吗? 0.667?

Mac*_*ula 5

样本权重

您可以使用sample_weights来衡量任何一个观察的重要性,就像您可以传递sample_weight给 sklearn分类器一样

大于 1 的权重将为该观察提供额外的权重;小于 1 的权重将使其对模型的重要性降低。

这是通过按权重缩放该观察的学习率来实现的。

互动

您不必创建单独的模型:这两种类型的交互可以愉快地嵌入到同一个模型中。

在 LightFM 模型中,交互矩阵中的数据是二进制的。您应该使用样本权重来表达您对给定交互为正的置信度。这可以是电影的观看百分比:但是,请注意,如果观看百分比通常低于 1.0,您的模型将更加重视文本交互。

  • 这是对的。如果要考虑点击次数,则应使用权重矩阵(但要注意非常大的权重,这些会影响拟合的稳定性)。 (2认同)