我想获得线性回归结果的置信区间。我正在使用波士顿房价数据集。
我发现了这个问题: 如何计算 python 线性回归模型中斜率的 99% 置信区间? 但是,这并不能完全回答我的问题。
这是我的代码:
import numpy as np
import matplotlib.pyplot as plt
from math import pi
import pandas as pd
import seaborn as sns
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# import the data
boston_dataset = load_boston()
boston = pd.DataFrame(boston_dataset.data, columns=boston_dataset.feature_names)
boston['MEDV'] = boston_dataset.target
X = pd.DataFrame(np.c_[boston['LSTAT'], boston['RM']], columns=['LSTAT', 'RM'])
Y = boston['MEDV']
# splits the training and test data set in 80% : …Run Code Online (Sandbox Code Playgroud) 我有以下数组:
a = np.array([1,2,9], [5,2,4], [1,2,3])
Run Code Online (Sandbox Code Playgroud)
任务是查找行总和大于10的所有行的索引,在我的示例中,结果应类似于 [0, 1]
我需要一个类似于这篇文章中推荐的过滤器: Filter rows of a numpy array?
但是,我只需要索引,而不需要实际值或它们自己的数组。
我当前的代码如下所示:
temp = a[np.sum(a, axis=1) > 5]
Run Code Online (Sandbox Code Playgroud)
如何获取过滤行的初始索引?