这取决于你对"紧密分组"的定义.一种可能性是样本方差或相应的标准偏差.粗略地说,这会给你一个远离中心点的"平均"距离(可以将其定义为已知点,或者简单地定义为数据集的平均值).
对于一组2D点,可以定义为:
stddev = sqrt(var) = sqrt(1/N * SUM { (x - x0)^2 + (y - y0)^2 })
Run Code Online (Sandbox Code Playgroud)
(x0,y0)样本均值在哪里(即所有点的平均值).
此度量标准对异常值的敏感性不如边界框度量标准.