多项逻辑回归是否适用于此数据集?

Fan*_*ion -3 python probability multinomial logistic-regression

我有以下数据集如下所示.500和900之间的任何值被归类为A,而在900和~1500之间的值在A和B之间混合.我想找到在任何x值处得到A,B和C的概率,其中x是我的自变量和A,B,C是我的因变量.它似乎非常适合多项Logistic回归.我相信每个因变量的观测数量就足够了.如果多项式日志回归是合适的,我希望使用Python的scikit学习逻辑回归模块来获得任何x值的A,B和C的概率,但我不知道如何使用该模块来解决这个问题.

在此输入图像描述

小智 6

就个人而言,它看起来像是一个可以用于逻辑回归的合适的候选者,但它看起来具有重叠的1维这一事实可能使得难以沿着这些部分分离.我主要在这里回答你问题的第二部分,它可以推广到scikit-learn中的几乎任何其他分类器.

我建议查看SGDClassifier上的scikit-learn部分,因为它在属性列表下面有一个简单的示例,但是用LogisticRegression类替换SGDClassifier部分. http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html#sklearn.linear_model.SGDClassifier

这里还有LogisticRegression的文档:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression