统计检测数据异常的最佳方法

Toa*_*oad 6 database statistics data-warehouse

我们的webapp收集大量有关用户操作,网​​络业务,数据库负载等的数据

所有数据都存储在仓库中,我们对这些数据有很多有趣的看法.

如果发生奇怪的事情,它会出现在数据的某个地方.

但是,要手动检测是否有异常情况发生,必须不断查看这些数据,并寻找奇怪之处.

我的问题:检测动态数据变化的最佳方法是什么,可以看作是"与众不同".

贝叶斯过滤器(我在阅读有关垃圾邮件检测时已经看过这些过滤器)的方法是什么?

任何指针都会很棒!

编辑:澄清数据例如显示数据库负载的每日曲线.此曲线通常看起来类似于昨天的曲线.此曲线可能会缓慢变化.

如果日常变化的曲线在某些周界内表示会发出警告,那将是很好的.

[R

Car*_*don 5

看一下控制图,它们提供了一种直观地跟踪数据变化的方法,并指定数据何时"失控"或"异常".它们大量用于制造以确保质量控制.


Ali*_*xel 1

贝叶斯分类可能会帮助您发现数据中的一些异常情况,具体取决于数据类型以及您训练贝叶斯过滤器的程度。

甚至还有一个可作为网络服务@ uClassify.com