Python Pandas:从数据框计算RMSE的简单示例

zor*_*ork 9 python pandas

需要一个使用Pandas DataFrame计算RMSE的简单示例.提供有循环true和预测值返回的函数:

def fun (data):
   ...
   return trueVal, predVal

for data in set:
   fun(data)
Run Code Online (Sandbox Code Playgroud)

然后一些代码将这些结果放在下面的数据框中,其中x是一个实数值并且p是预测值:

In [20]: d
Out[20]: {'p': [1, 10, 4, 5, 5], 'x': [1, 2, 3, 4, 5]}

In [21]: df = pd.DataFrame(d)

In [22]: df
Out[22]: 
    p  x
0   1  1
1  10  2
2   4  3
3   5  4
4   5  5
Run Code Online (Sandbox Code Playgroud)

问题:

1)如何fundf数据框中输入函数的结果?

2)如何使用df数据框计算RMSE ?

piR*_*red 16

问题1
这取决于数据的格式.我希望你已经拥有了你的真实值,所以这个函数只是一个传递.

问题2

pandas
((df.p - df.x) ** 2).mean() ** .5

numpy
(np.diff(df.values) ** 2).mean() ** .5

  • 不应该是`((df.p - df.x)**2).mean()**.5`对于大熊猫,因为它的根**意味着**平方误差? (2认同)
  • 用户名未签出:) (2认同)