我正在尝试进行一些数据分析,其想法是使用autobinning
命令创建最佳箱柜,计算每个箱柜的WOE(证据权重)值,然后用相应的WOE值替换属于每个箱柜的原始值.以下是我的工作:
CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0);
scAB = autobinning(CreSC,'Algorithm','Monotone');
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE');
Run Code Online (Sandbox Code Playgroud)
问题是上述过程不考虑NaN
DATA中的值并自动排除它们.
我的目标是仅为NaN
值创建一个单独的bin,并强制autobinning
命令考虑这些NaN
值.
有没有人有合理的解决方案?