标签: statistics

宇宙射线:它们对程序产生影响的概率是多少?

我再一次进行了设计评审,并且遇到了一个声称特定情景的概率"低于宇宙射线的风险"影响该程序的说法,并且我发现我没有最微弱的想法是什么概率是.

"因为2 -128是340282366920938463463374607431768211456中的1个,我认为我们在这里抓住机会是合理的,即使这些计算已经减少了几十亿......我们对宇宙射线的风险更大我相信,把我们搞砸了."

这个程序员是否正确?宇宙射线撞击计算机并影响程序执行的概率是多少?

statistics physics probability error-detection risk-analysis

529
推荐指数
14
解决办法
5万
查看次数

如何计算Git存储库中特定作者更改的总行数?

是否有一个我可以调用的命令,它将计算Git存储库中特定作者更改的行?我知道必须有方法来计算提交次数,因为Github会为其影响图执行此操作.

git statistics command-line repository

420
推荐指数
17
解决办法
24万
查看次数

是否有用于查找模式的内置功能?

在R中,mean()median()是标准函数,可以满足您的期望. mode()告诉您对象的内部存储模式,而不是其参数中出现最多的值.但是有一个标准的库函数来实现向量(或列表)的统计模式吗?

statistics r r-faq

370
推荐指数
14
解决办法
25万
查看次数

从Git存储库生成统计信息

我正在寻找一些好的工具/脚本,允许我从git存储库生成一些统计信息.我在一些代码托管网站上看过这个功能,它们包含的信息如...

  • 每位作者提交
  • 提交每天/每周/每年/等.
  • 代码行随着时间的推移
  • ... 多得多

基本上我只是想知道我的项目随着时间的推移增长了多少,哪个开发人员提交大多数代码,等等.

git statistics graph

346
推荐指数
9
解决办法
19万
查看次数

在Python中计算算术平均值(一种平均值)

Python中是否有内置或标准库方法来计算数字列表的算术平均值(一种平均值)?

python math statistics average mean

258
推荐指数
6
解决办法
62万
查看次数

如何使用python/numpy计算百分位数?

有没有一种方便的方法来计算序列或单维numpy数组的百分位数?

我正在寻找类似于Excel的百分位函数的东西.

我查看了NumPy的统计参考,但是找不到这个.我能找到的只是中位数(第50百分位数),但不是更具体的东西.

python statistics numpy percentile numpy-ndarray

193
推荐指数
7
解决办法
24万
查看次数

用MySQL计算中值的简单方法

使用MySQL计算中值的最简单(并且希望不是太慢)的方法是什么?我已经习惯AVG(x)了找到平均值,但我很难找到一种计算中位数的简单方法.现在,我将所有行返回给PHP,进行排序,然后选择中间行,但肯定必须有一些简单的方法在单个MySQL查询中执行此操作.

示例数据:

id | val
--------
 1    4
 2    7
 3    2
 4    2
 5    9
 6    8
 7    3
Run Code Online (Sandbox Code Playgroud)

排序上val给出2 2 3 4 7 8 9的,所以中间应该是4,与SELECT AVG(val)这== 5.

mysql sql statistics median

191
推荐指数
12
解决办法
22万
查看次数

在Python中计算Pearson相关性和显着性

我正在寻找一个函数,它将两个列表作为输入,并返回Pearson相关性相关性的重要性.

python statistics numpy scipy

185
推荐指数
11
解决办法
34万
查看次数

统计分析和报告编写的工作流程

有没有人对与自定义​​报告编写相关的数据分析工作流程有任何了解?用例基本上是这样的:

  1. 客户委托使用数据分析的报告,例如人口估计和水区的相关地图.

  2. 分析人员下载一些数据,对数据进行检测并保存结果(例如,为每个单位添加一列,或根据区域边界对数据进行子集化).

  3. 分析师分析了(2)中创建的数据,接近她的目标,但看到需要更多数据,因此可以追溯到(1).

  4. 冲洗重复,直到表格和图形符合QA/QC并满足客户要求.

  5. 编写包含表格和图形的报告.

  6. 明年,快乐的客户回来了,想要更新.这应该像通过新下载更新上游数据一样简单(例如,从去年获得建筑许可),并按下"RECALCULATE"按钮,除非规格发生变化.

目前,我只是开始一个目录,并尽我所能.我想要一个更系统化的方法,所以我希望有人能够解决这个问题......我使用了电子表格,SQL,ARCGIS,R和Unix工具.

谢谢!

PS:

下面是一个基本的Makefile,用于检查各种中间数据集(带.RData后缀)和脚本(.R后缀)的依赖关系.使用时间戳来检查依赖关系,因此,如果您touch ss07por.csv,它将看到此文件比依赖它的所有文件/目标更新,并执行给定的脚本以便相应地更新它们.这仍然是一项正在进行的工作,包括放入SQL数据库的步骤,以及像sweave这样的模板语言的步骤.请注意,Make依赖于语法中的选项卡,因此请在剪切和粘贴之前阅读手册.享受并提供反馈!

http://www.gnu.org/software/make/manual/html_node/index.html#Top

R=/home/wsprague/R-2.9.2/bin/R

persondata.RData : ImportData.R ../../DATA/ss07por.csv Functions.R
   $R --slave -f ImportData.R

persondata.Munged.RData : MungeData.R persondata.RData Functions.R
      $R --slave -f MungeData.R

report.txt:  TabulateAndGraph.R persondata.Munged.RData Functions.R
      $R --slave -f TabulateAndGraph.R > report.txt

statistics r data-visualization

181
推荐指数
8
解决办法
4万
查看次数

Python NumPy中的np.mean()vs np.average()?

我注意到了

In [30]: np.mean([1, 2, 3])
Out[30]: 2.0

In [31]: np.average([1, 2, 3])
Out[31]: 2.0
Run Code Online (Sandbox Code Playgroud)

但是,应该存在一些差异,因为毕竟它们是两个不同的功能.

它们之间有什么区别?

python statistics numpy average mean

170
推荐指数
4
解决办法
12万
查看次数