我有一篇论文中的数据集,我很难验证他们报告的决定系数 R 平方。我使用了 sklearn 和 scipy 库,但得到了不同的答案。为什么?哪个更可靠?ps 当我使用 Excel 作为另一种选择时,我得到了与 scipy 相同的答案。
下面是我用来比较 SKlearn 和 Scipy 结果的代码:
import pandas as pd
from scipy import stats
from sklearn.metrics import r2_score
data = pd.read_csv("output.csv", header=None)
y_measured = data.iloc[0, :].values
y_predicted = data.iloc[1, :].values
print(r2_score(y_measured, y_predicted)) # prints 0.708717556205
slope, intercept, r_value, p_value, std_err = stats.linregress(y_measured, y_predicted)
print(r_value**2) # prints 0.731889173485
Run Code Online (Sandbox Code Playgroud)