yzh*_*ang 6 algorithm artificial-intelligence machine-learning data-mining
我面临一个关于序列挖掘的棘手问题,比如我有10个产品,我有数百万条记录,每条记录包含购买的用户,产品和时间戳.每个用户可能只有1条记录或100条记录..例如:
user 1, p1, t1
user 1, p1, t2
user 1, p2, t3
user 1, p3, t4
user 1, p1, t5
user 2, p2, t6.....
Run Code Online (Sandbox Code Playgroud)
现在我需要预测何时是为用户推广产品的最佳时机.
到目前为止,我的解决方案是将时间分为几类.然后在数据上应用Apriori,例如记录就像
user 1, p1T1
user 1, p2T2
user 1, p3T2
user 1, p2T1...
Run Code Online (Sandbox Code Playgroud)
然后我会得到像p1T1-> p2T2等规则,因为T3> T2> T1 ...任何规则都不适合这种情况将被丢弃.
但是,我对这个解决方案不是很满意.有什么建议?
你的问题是推荐系统的应用,你可以从2011年KDD杯中学到一些东西。虽然推荐的项目是音乐,但是模型也可以满足您的要求。而且大多数模型都会考虑时间,如果你仍然不满意,你应该学习一些时间序列分析和机器学习来进行预测。