我正在研究Telecom Churn问题,这是我的数据集.
http://www.sgi.com/tech/mlc/db/churn.data
名称 - http://www.sgi.com/tech/mlc/db/churn.names
我是生存分析的新手.给出了训练数据,我的想法是建立一个生存模型来估计生存时间,同时根据独立因素预测测试数据的流失/非流失.可以有人帮我编写代码或指针关于如何解决这个问题.
确切地说,我的火车数据已经得到了
客户电话使用细节,计划详情,他的帐户任期等,以及他是否流失.
使用一般分类模型,我可以预测测试数据的流失与否.现在使用生存分析,我想预测测试数据中的生存期限.
谢谢,Maddy