我有一张桌子:
LocationId OriginalValue Mean
1 0.45 3.99
2 0.33 3.99
3 16.74 3.99
4 3.31 3.99
Run Code Online (Sandbox Code Playgroud)
等等......
我如何计算出Standard Deviation使用此表以及您会推荐什么?STDEVP或者STDEV?
快问.我将csv文件读入变量data.它有一个列标签var,它有数值.
当我运行命令
sd(data$var)
Run Code Online (Sandbox Code Playgroud)
我明白了
[1] NA
Run Code Online (Sandbox Code Playgroud)
而不是我的标准差.
你能帮我弄清楚我做错了什么吗?
var、sd、cor函数用作分母(其中观测值{stats}的数量)。出于好奇,是否有等效函数用作分母?n-1nn
我试图了解如何识别我将发送到电子表格的统计异常值。我需要按索引对行进行分组,然后找到特定列的 stdev,任何超出 stdev 的内容都将用于填充电子表格。
df = pandas.DataFrame({'Sex': ['M','M','M','F','F','F','F'], 'Age': [33,42,19,64,12,30,32], 'Height': ['163','167','184','164','162','158','160'],})
Run Code Online (Sandbox Code Playgroud)
使用这样的数据集,我想按性别分组,然后找到超过年龄或身高标准差的条目。我见过的大多数例子都是针对整个数据集的 stdev,而不是按列细分。将有额外的列,例如 state,所以我不需要每列的 stdev,只需要集合中的特定列。
寻找输出只包含在任一列中被标识为统计异常值的行的数据。例如:
0 M 64 164
1 M 19 184
Run Code Online (Sandbox Code Playgroud)
假设64岁超过男性身高标准,身高184厘米超过男性身高标准
stdev ×4
r ×2
statistics ×2
correlation ×1
na ×1
pandas ×1
python ×1
sql ×1
sql-server ×1
stdevp ×1
t-sql ×1
var ×1