STDDEV_POP 与 STDDEV_SAMP

9 postgresql aggregate aggregate-functions

有人可以向我解释一下 postgres 中这两个函数的区别是什么以及什么时候给你解释一下吗?

我的表中有这些数据,并且想计算行程采样率的标准偏差:

  user_id |      trip_id       |       lat        |       lon        | sampling_rate 
---------+--------------------+------------------+------------------+---------------
     126 | 125020080511025052 | 39.9531666666667 | 116.452566666667 |             7
     126 | 125020080511025052 |         39.95305 | 116.452683333333 |            16
     126 | 125020080511025052 | 39.9530666666667 | 116.452916666667 |            44
     126 | 125020080511025052 | 39.9530833333333 | 116.453183333333 |            40
     126 | 125020080511025052 |         39.95335 |        116.45365 |            21
     126 | 125020080511025052 | 39.9532833333333 | 116.453816666667 |            16
     126 | 125020080511025052 | 39.9533166666667 |        116.45405 |            13
     126 | 125020080511025052 | 39.9535666666667 | 116.454383333333 |            24
     126 | 125020080511025052 | 39.9537166666667 |         116.4546 |            16
     126 | 125020080511025052 | 39.9538333333333 | 116.454733333333 |            17
Run Code Online (Sandbox Code Playgroud)

Mik*_*nek 6

这是一个统计问题,而不是一个编程或数据库问题。

简而言之,除非您有理由使用总体标准差并了解为什么要使用总体标准差,否则您将使用样本标准差。

stddev()Postgreql 中的 映射到stddev_samp().

这是一篇很长的文章,但它涵盖了基础知识: https ://statistics.laerd.com/statistical-guides/measures-of-spread-range-quartiles.php

随着样本中观测值数量的增加,样本标准差向总体标准差收敛。