熊猫系列均值和标准差

Question

熊猫系列均值和标准差

我有一个清单：

data = [
{'A': [2.0, 3.0, 4.0, 5.0, 6.0], 'B':[27.0, 28.0, 29.0, 30.0], 'C': ['lic1'],
 'D': ['soy1'], 'E': ['foo1']},
{'A': [7.0, 11.0, 90.0, 43.0, 87.0], 'B':[27.0, 28.0, 29.0, 30.0], 'C': ['lic1'],
 'D': ['soy1'], 'E': ['foo1']},
# ... etc

Run Code Online (Sandbox Code Playgroud)

]

“ A”上的数据是熊猫系列。我想计算“ A”中数据的平均偏差和标准偏差（A有多个记录），例如：（平均值=（2.0 + 3.0 + 4.0 + 5.0 + 6.0 + 7.0 + 11.0 + 90.0 + 43.0 + 87.0）/ len（A）= 25.8）

Answer 1

jez*_*ael 5

您可以使用list comprehension，concat然后使用mean或std。

为了转换为float（int）添加astype，如果to_numeric参数仍然需要问题errors='coerce'。

s = pd.concat([pd.Series(x['A']) for x in data]).astype(float)
print (s)
0     2.0
1     3.0
2     4.0
3     5.0
4     6.0
0     7.0
1    11.0
2    90.0
3    43.0
4    87.0
dtype: float64

print (s.mean())
25.8

print (s.std())
35.15299892375234

Run Code Online (Sandbox Code Playgroud)

另一个解决方案：

from  itertools import chain

s = pd.Series(list(chain.from_iterable([x['A'] for x in data]))).astype(float)
print (s)
0     2.0
1     3.0
2     4.0
3     5.0
4     6.0
5     7.0
6    11.0
7    90.0
8    43.0
9    87.0
dtype: float64

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，9 月前
查看次数：	10060 次
最近记录：	8 年，9 月前