LightFM：权重和样本权重

Question

我希望深入了解 LightFM 实现以下方面的权重：

现在，如果我与不同的content_types ie进行用户交互text，video并且我们在提出建议时不想真正区分它们？
- 我是否必须为每种媒体类型制作单独的模型？如果我创建一个模型，如果 for 的交互text是一个布尔值，如 1.0/0.0 的点击，如果交互video是 inpercentage_video_completed例如，如果用户看到 15 秒视频中的 10 秒，我可以分配权重吗？ 0.667？

Answer 1

您可以使用sample_weights来衡量任何一个观察的重要性，就像您可以传递sample_weight给 sklearn分类器一样。

大于 1 的权重将为该观察提供额外的权重；小于 1 的权重将使其对模型的重要性降低。

这是通过按权重缩放该观察的学习率来实现的。

您不必创建单独的模型：这两种类型的交互可以愉快地嵌入到同一个模型中。

在 LightFM 模型中，交互矩阵中的数据是二进制的。您应该使用样本权重来表达您对给定交互为正的置信度。这可以是电影的观看百分比：但是，请注意，如果观看百分比通常低于 1.0，您的模型将更加重视文本交互。