Wes*_*ssi 2 python csv python-3.x
我有一个如下所示的 CSV 文件:
DATE,TEMP
0101,39.0
0102,40.9
0103,44.4
0104,41.0
0105,40.0
0106,42.2
...
0101,41.0
0102,39.9
0103,44.6
0104,42.0
0105,43.0
0106,42.4
Run Code Online (Sandbox Code Playgroud)
这是特定日期的温度列表。它包含几年的数据,因此相同的日期出现多次。我想平均温度,以便我得到一个新表,其中每个日期只出现一次,并在第二列中包含该日期的平均温度。
我知道 Stack Overflow 要求您包括您尝试过的内容,但我真的不知道该怎么做,也找不到任何其他答案。
我希望有人能帮帮忙。任何帮助深表感谢。
当 df 是您的数据框时,您可以使用 Pandas,并运行 groupby 命令:
df.groupby('DATE').mean()
Run Code Online (Sandbox Code Playgroud)
这是一些描述行为的玩具示例
import pandas as pd
df=pd.DataFrame({"a":[1,2,3,1,2,3],"b":[1,2,3,4,5,6]})
df.groupby('a').mean()
Run Code Online (Sandbox Code Playgroud)
会导致
a b
1 2.5
2 3.5
3 4.5
Run Code Online (Sandbox Code Playgroud)
当原始数据框是
a b
0 1 1
1 2 2
2 3 3
3 1 4
4 2 5
5 3 6
Run Code Online (Sandbox Code Playgroud)