Logle回归与sklearn

Bar*_*ich 4 python classification scikit-learn logistic-regression

不确定这是否是这个问题的好地方,但我被告知CrossValidated不是.所以,所有这些问题都涉及sklearn,但如果你对逻辑回归有一般的见解,我也很乐意听到它们.

1)数据是否必须标准化(平均0,stdev 1)?
2)在sklearn中,如何指定我想要的正则化类型(L1与L2)?请注意,这与惩罚不同; 惩罚是指分类错误,而不是对系数的修正.
3)我如何使用变量选择?即,类似于用于线性回归的套索.
4)使用正则化时,如何优化C,正则化强度?有内置的东西,还是我自己要照顾好这个?

可能一个例子是最有帮助的,但我很欣赏任何这些问题的见解.

这是我的出发点:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

非常感谢你提前!

Ans*_*ari 5

1)对于逻辑回归,没有.您没有计算实例之间的距离.

2)您可以指定penalty='l1'penalty='l2'参数.请参阅LogisticRegression页面.L2惩罚是默认的.

3)有迹象表明,scikit学习提供,例如使用各种明确的特征选择技术SelectKBest卡方排名功能.

4)您将要进行网格搜索以获得最佳参数.

有关所有这些问题的更多详细信息,我建议您阅读一些示例,例如本章本章.