我需要知道一组数字与一组数字相比是否超出了平均值的1 stddev等.
我正在编写一本关于C的编程书A Book.练习建议找到一组数字的平均值,算法:
avg += (x - avg) / i;
Run Code Online (Sandbox Code Playgroud)
比以下更好:
sum += x;
avg = sum / i;
Run Code Online (Sandbox Code Playgroud)
'x'是用于存储输入数字的变量.它还建议除了防止溢出之外,第一个算法确实比第二个algorthim有其他一些好处,任何人都可以帮助我吗?谢谢!
是否有一种pythonic方法来构建包含某些函数的运行平均值的列表?
在阅读了一篇关于火星人,黑匣子和柯西分布的有趣小块之后,我认为自己计算Cauchy分布的平均值会很有趣:
import math
import random
def cauchy(location, scale):
p = 0.0
while p == 0.0:
p = random.random()
return location + scale*math.tan(math.pi*(p - 0.5))
# is this next block of code a good way to populate running_avg?
sum = 0
count = 0
max = 10
running_avg = []
while count < max:
num = cauchy(3,1)
sum += num
count += 1
running_avg.append(sum/count)
print running_avg # or do something else with …Run Code Online (Sandbox Code Playgroud) 在我们的日志文件中,我们存储请求的响应时间.计算中间响应时间的最有效方法是什么,"75/90/95%的请求是在少于N个时间内提供的"数字等?(我想我的问题的一个变体是:计算一串数字流的中位数和标准差的最佳方法是什么).
我想出的最好的只是阅读所有数字,订购它们然后挑出数字,但这看起来真的很傻.是不是有更聪明的方法?
我们使用Perl,但任何语言的解决方案都可能有所帮助.
我正在寻找Perl的统计软件包(CPAN很好),它允许我以递增方式添加数据,而不必传递整个数据数组.
只需要均值,中位数,stddev,max和min是必要的,没有什么太复杂的.
原因是因为我的数据集太大而无法放入内存中.数据源位于MySQL数据库中,所以现在我只是查询数据的子集并计算它们的统计数据,然后再组合所有可管理的子集.
如果您对如何克服这个问题有其他想法,我会非常感激!
我有一个熊猫系列.我需要得到sigma_i,这是索引i的系列的标准偏差.是否有任何有效计算的功能?
我注意到有cummax,cummin功能.
我有很多数据存储在大型数组的磁盘上.我无法将所有内容完全加载到内存中.
如何计算平均值和标准差?