小编Mas*_*ali的帖子

scikit-learn 和 scipy 库的决定系数不同。为什么？

我有一篇论文中的数据集，我很难验证他们报告的决定系数 R 平方。我使用了 sklearn 和 scipy 库，但得到了不同的答案。为什么？哪个更可靠？ps 当我使用 Excel 作为另一种选择时，我得到了与 scipy 相同的答案。

下面是我用来比较 SKlearn 和 Scipy 结果的代码：

import pandas as pd
from scipy import stats
from sklearn.metrics import r2_score

data = pd.read_csv("output.csv", header=None)

y_measured = data.iloc[0, :].values
y_predicted = data.iloc[1, :].values

print(r2_score(y_measured, y_predicted)) # prints 0.708717556205

slope, intercept, r_value, p_value, std_err = stats.linregress(y_measured, y_predicted)

print(r_value**2)  # prints 0.731889173485

Run Code Online (Sandbox Code Playgroud)

python statistics scipy scikit-learn

Mas*_*ali

lucky-day

3
推荐指数

1
解决办法

2415
查看次数