Python - 唯一值的平均值

Wes*_*ssi 2 python csv python-3.x

我有一个如下所示的 CSV 文件:

DATE,TEMP
0101,39.0
0102,40.9
0103,44.4
0104,41.0
0105,40.0
0106,42.2
...
0101,41.0
0102,39.9
0103,44.6
0104,42.0
0105,43.0
0106,42.4
Run Code Online (Sandbox Code Playgroud)

这是特定日期的温度列表。它包含几年的数据,因此相同的日期出现多次。我想平均温度,以便我得到一个新表,其中每个日期只出现一次,并在第二列中包含该日期的平均温度。

我知道 Stack Overflow 要求您包括您尝试过的内容,但我真的不知道该怎么做,也找不到任何其他答案。

我希望有人能帮帮忙。任何帮助深表感谢。

Mir*_*ber 5

当 df 是您的数据框时,您可以使用 Pandas,并运行 groupby 命令:

df.groupby('DATE').mean()
Run Code Online (Sandbox Code Playgroud)

这是一些描述行为的玩具示例

import pandas as pd
df=pd.DataFrame({"a":[1,2,3,1,2,3],"b":[1,2,3,4,5,6]})
df.groupby('a').mean()
Run Code Online (Sandbox Code Playgroud)

会导致

a   b
1   2.5
2   3.5
3   4.5
Run Code Online (Sandbox Code Playgroud)

当原始数据框是

    a   b
0   1   1
1   2   2
2   3   3
3   1   4
4   2   5
5   3   6
Run Code Online (Sandbox Code Playgroud)