我的数据:
State N Var1 Var2
Alabama 23 54 42
Alaska 4 53 53
Arizona 53 75 65
Run Code Online (Sandbox Code Playgroud)
Var1并且Var2是州级的汇总百分比值。N是每个状态的参与者数量。我想之间运行的线性回归Var1和Var2与所述考虑的N作为重量与在Python 2.7 sklearn。
一般线路是:
fit(X, y[, sample_weight])
Run Code Online (Sandbox Code Playgroud)
假设数据被加载到df使用 Pandas 并且N变成了df["N"],我是简单地将数据放入下一行还是我需要在使用它之前以某种方式处理 N 就像sample_weight在命令中一样?
fit(df["Var1"], df["Var2"], sample_weight=df["N"])
Run Code Online (Sandbox Code Playgroud) 为了组合同一变量的3个不同的估计器,我需要在Java中实现多元回归方法(因此3个独立变量和1个因变量).我正在寻找一种简单的方法(就像多元回归方法一样简单).从我所做的搜索来看,我认为最小二乘法应该是一种适当的方法,但我想知道你是否建议任何其他方法.我也没能找到关于在多变量上下文最小二乘法的执行任何好的文档,所以我将不胜感激,如果你可以指向我,我可以使用任何良好的信息/来源.