Ask*_*sen 10 statistics perl logging median
在我们的日志文件中,我们存储请求的响应时间.计算中间响应时间的最有效方法是什么,"75/90/95%的请求是在少于N个时间内提供的"数字等?(我想我的问题的一个变体是:计算一串数字流的中位数和标准差的最佳方法是什么).
我想出的最好的只是阅读所有数字,订购它们然后挑出数字,但这看起来真的很傻.是不是有更聪明的方法?
我们使用Perl,但任何语言的解决方案都可能有所帮助.
你可以看看快速选择:
http://en.wikipedia.org/wiki/Selection_algorithm
或者在Wirth算法:http: //www.mail-archive.com/numpy-discussion@scipy.org/msg20059.html
可以在此处找到中位数的基准:http: //ndevilla.free.fr/median/median/index.html
| 归档时间: |
|
| 查看次数: |
4349 次 |
| 最近记录: |