我是Python的新手,并试图在pandas数据帧上使用sklearn执行线性回归.这就是我做的:
data = pd.read_csv('xxxx.csv')
Run Code Online (Sandbox Code Playgroud)
之后我得到了两列的DataFrame,让我们称之为'c1','c2'.现在我想对(c1,c2)的集进行线性回归,所以我输入了
X=data['c1'].values
Y=data['c2'].values
linear_model.LinearRegression().fit(X,Y)
Run Code Online (Sandbox Code Playgroud)
这导致以下错误
IndexError: tuple index out of range
Run Code Online (Sandbox Code Playgroud)
这有什么不对?另外,我想知道
我搜索并浏览了大量网站,但似乎没有一个网站指示初学者正确的语法.也许对于像我这样的新手而言,对专家来说显而易见的事情并不那么明显.
你能帮忙吗?非常感谢您的宝贵时间.
PS:我注意到大量的初学者问题在stackoverflow中被低估了.请注意这样一个事实,即专家用户看似显而易见的事情可能需要一个初学者的日子才能弄明白.按下向下箭头时请谨慎使用,以免损害本讨论社区的活力.
有没有人知道Java中的科学/数学库可以直接实现加权线性回归?一个函数行的东西,它接受3个参数并返回相应的系数:
linearRegression(x,y,weights)
Run Code Online (Sandbox Code Playgroud)
这似乎相当简单,所以我想它存在于某个地方.
PS)我已经尝试过Flannigan的图书馆:http://www.ee.ucl.ac.uk/~mflanaga/java/Regression.html ,它有正确的想法,但似乎偶尔崩溃并抱怨我的自由度?