有人可以帮助我用外行的术语解释 AWS Personalize 解决方案版本指标,或者至少告诉我这些指标在理想情况下应该是什么样子?
我对机器学习一无所知,并希望利用 Personalize,因为它作为“无需先前知识”的 ML SaaS 进行营销。然而,我的解决方案结果中的“解决方案版本指标”似乎需要相当高水平的数学知识。
我的解决方案版本的指标如下:
归一化贴现累计
在5:0.9881,在10:0.9890,在25:0.9898
精度
在5:0.1981,在10:0.0993,在25:0.0399
平均倒数排名
在25:0.9833
研究
我浏览了个性化开发人员指南,其中包括第 72 页上每个指标的简短定义。我还尝试浏览维基百科关于折扣累积增益和平均互惠排名的文章。通过阅读,这是我对每个指标的解释:
NDG = 推荐相关性的一致性;第一条建议和最后一条建议一样相关吗?
精度 = 推荐给用户的相关性;您的建议与所有用户的相关性如何?
MRR = 列表中第一个推荐与列表中其他推荐的相关性;您的第一个推荐与每个用户的相关性如何?
如果这些解释是正确的,那么我的解决方案指标表明我在推荐不相关的内容方面是高度一致的。这是一个有效的结论吗?
例如,我使用 4 个数据集组:-
在每个 datasetGroup 中,我们有 3 个数据集,名称为 Users、Item 和 Item_User_INTERACTIONS
我们还为每个数据集组提供了一个解决方案和活动。
我还使用 API (putEvent) 将实时事件发送到 AWS Personalize
上述事情在两天内花费了我大约 100 美元,并显示使用了 498 TPS 小时,我无法找到这么多成本的真正原因。
或者 AWS Personalize 的成本就这么高吗?
我正在使用 Amazon Personalize 创建推荐引擎。我必须为它发送以下数据,
USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,TIMESTAMP
Run Code Online (Sandbox Code Playgroud)
我不明白EVENT_TYPE,并EVENT_VALUE在里面。
我正在尝试实现个性化,但在项目架构方面遇到问题。
想象一下我是亚马逊,我有他们的品牌和类别的产品。我应该在哪种项目架构中包含此信息?
我应该将品牌名称作为字符串包含为分类字段吗?我应该将品牌 ID 作为字符串还是数字包含在内?或者我应该包括两者?
那么类别呢?我也有同样的疑问。
元数据字段 元数据包括不需要或不使用保留关键字的字符串或非字符串字段。元数据模式具有以下限制:
用户和项目模式至少需要一个元数据字段,
用户和交互数据集最多可以包含五个元数据字段。项目数据集最多可以包含 50 个元数据字段。
如果您添加自己的字符串类型元数据字段,则它必须包含分类属性。否则,Amazon Personalize 在训练模型时不会使用该字段。
https://docs.aws.amazon.com/personalize/latest/dg/how-it-works-dataset-schema.html