nic*_*ckf 4 language-agnostic algorithm statistics google-maps
我正在做一些工作来处理某个月的家庭批准的一些统计数据.我希望能够显示趋势 - 也就是说,自上个月以来哪些区域的相对增加或减少很大.
我的第一个天真的方法是计算两个月之间的百分比变化,但是当数据非常低时会出现问题 - 任何变化都会被放大:
// diff = (new - old) / old
Area | June | July | Diff |
--------------|--------|--------|--------|
South Sydney | 427 | 530 | +24% |
North Sydney | 167 | 143 | -14% |
Dubbo | 1 | 3 | +200% |
Run Code Online (Sandbox Code Playgroud)
我不想忽视任何区域或价值作为异常值,但我不希望Dubbo每月增加2个,超过南悉尼增加103个.有没有更好的方程式可以用来显示更有用的趋势信息?
此数据最终会在Google地图上绘制.在第一次尝试中,我只是将差异转换为"热图颜色"(蓝色 - 减少,绿色 - 没有变化,红色 - 增加).可能使用一些其它度量来改变每个区域的视图可能是一个解决办法,例如,改变基于批准或类似的东西的总数α通道,在这种情况下,多宝将是明亮的红色,但相当透明的,而南悉尼将更接近黄色但非常不透明.
有关显示此数据的最佳方式的任何想法?
研究具有统计意义的措施.它可以像假设计数统计一样简单.
在一个非常简单的版本中,你绘制的是
(A_2 - A_1)/sqrt(A_2 + A_1)
Run Code Online (Sandbox Code Playgroud)
即在简单计数统计中改变超过1西格玛.
这使得上面的图表看起来像:
Area Reduced difference
--------------------------
S.S. +3.3
N.S. -1.3
D. +1.0
Run Code Online (Sandbox Code Playgroud)
这被解释为意味着南悉尼经历了一个重要的(即重要的,可能与真正的潜在原因有关)增加,而北悉尼和达博觉得相对较小的变化可能会或可能不会指向趋势.经验法则
价格非常低的区域(如Dubbo)仍然会出现波动,但它们不会压倒显示屏.
| 归档时间: |
|
| 查看次数: |
1925 次 |
| 最近记录: |