使用R的电信流失生存分析

mad*_*ddy 4 r sas cox-regression survival-analysis logistic-regression

我正在研究Telecom Churn问题,这是我的数据集.

http://www.sgi.com/tech/mlc/db/churn.data

名称 - http://www.sgi.com/tech/mlc/db/churn.names

我是生存分析的新手.给出了训练数据,我的想法是建立一个生存模型来估计生存时间,同时根据独立因素预测测试数据的流失/非流失.可以有人帮我编写代码或指针关于如何解决这个问题.

确切地说,我的火车数据已经得到了

客户电话使用细节,计划详情,他的帐户任期等,以及他是否流失.

使用一般分类模型,我可以预测测试数据的流失与否.现在使用生存分析,我想预测测试数据中的生存期限.

谢谢,Maddy

Joh*_*tom 10

如果您仍然感兴趣(或者为了后来的那些人的利益),我已经编写了一些专门用于使用R对客户流失数据进行生存分析的指南.它们涵盖了一系列不同的分析技术,所有这些都包含样本数据和R代码.

基本生存分析:http://daynebatten.com/2015/02/customer-churn-survival-analysis/

基本的cox回归:http://daynebatten.com/2015/02/customer-churn-cox-regression/

考克斯回归中的时间依赖协变量:http://daynebatten.com/2015/12/survival-analysis-customer-churn-time-varying-covariates/

cox回归中与时间相关的系数:http://daynebatten.com/2016/01/customer-churn-time-dependent-coefficients/

受限制的平均生存时间(用美元计算流失的影响):http://daynebatten.com/2015/03/customer-churn-restricted-mean-survival-time/

伪观察(量化与变量的流失效应相关的美元收益/损失):http://daynebatten.com/2015/03/customer-churn-pseudo-observations/

请原谅愚蠢的图像.