Python数据框：使用Groupby在一列上计算R ^ 2和RMSE

Question

Python数据框：使用Groupby在一列上计算R ^ 2和RMSE

Pin*_*ts0 3 python model dataframe pandas-groupby

我有以下Python数据框：

Type    Actual  Predicted
A       4       3
A       10      18
A       13      11
B       3       10
B       4       2
B       8       33
C       20      17
C       40      33
C       87      80
C       32      30

Run Code Online (Sandbox Code Playgroud)

我有用于计算R ^ 2和RMSE的代码，但我不知道如何通过不同的“类型”来计算它。

现在，我的方法是将较大的表分为仅由A，B，C值组成的三个较小的表，然后从每个较小的表计算R ^ 2和RMSE，然后将它们重新附加在一起。

但是上述方法效率低下，我相信应该有一个更简单的方法吗？

下面是我希望将结果分组时产生的结果格式：

Type    R^2     RMSE    
A       value   value   
B       value   value   
C       value   value

Run Code Online (Sandbox Code Playgroud)

Answer 1

小智 8

这是一个groupby方法：

import numpy as np
import pandas as pd
from sklearn.metrics import r2_score, mean_squared_error

def r2_rmse( g ):
    r2 = r2_score( g['Actual'], g['Predicted'] )
    rmse = np.sqrt( mean_squared_error( g['Actual'], g['Predicted'] ) )
    return pd.Series( dict(  r2 = r2, rmse = rmse ) )

your_df.groupby( 'Type' ).apply( r2_rmse ).reset_index()

Run Code Online (Sandbox Code Playgroud)

`return` 语句可以修改为 `return pd.Series({'r2':r2, 'rmse':rmse})` (2认同)

归档时间：	8 年，2 月前
查看次数：	2366 次
最近记录：	8 年，2 月前