Tim*_*Tim 4 machine-learning forecasting
我知道MAPE和WMAPE作为预测误差指标,它们有一些好处.但差距是什么?有人说:
For MAPE: "Combinations with very small or zero volumes can cause large skew in results" And for WMAPE: "Combinations with large weights can skew the results in their favor"
我无法理解,任何人都可以解释这两个指标弱点的两个陈述吗?谢谢.
对于MAPE,平均绝对百分比误差[1],假设我们用A表示实际值,用P表示预测值.您在1到n时间有一系列数据,然后
MAPE = 100/n * ( Sum of |(A(t) - P(t))/A(t)| ), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
Run Code Online (Sandbox Code Playgroud)
由于A(t)在分母中,每当你有一个非常小或接近零的A(t)时,该除法就像是除以零,这会在绝对百分比误差中产生非常大的变化.这种大的变化的组合肯定会导致结果的大的偏差.
对于WMAPE,加权平均绝对百分比误差,
Sum of |(A(t) - P(t))/A(t)| * W(t)
WMPAE = -------------------------------------, for t in 1..n
Sum of W(t)
where W(t) is the weight you associate with the prediction at time t.
Run Code Online (Sandbox Code Playgroud)
由于这是加权测量,因此它没有与MAPE相同的问题,例如,由于体积非常小或零而导致的过度偏斜.
然而,加权因子将表明我们希望对每个预测进行主观重要性[2].
例如,考虑到发布日期,我们可以通过权重越高,我们对更新近数据的重要性越高来分配权重.在这种情况下,我们可以观察到,即使MAE处于合理的阈值,在分析此特定功能时系统的性能可能也不足.
这是对最近数据的偏好如何扭曲结果.
[1] http://en.wikipedia.org/wiki/Mean_absolute_percentage_error
[2] http://ir.ii.uam.es/rue2012/papers/rue2012-cleger-tamayo.pdf
Run Code Online (Sandbox Code Playgroud)