我正在使用Python中的scikit-learn开发一种分类算法来预测某些客户的性别.除此之外,我想使用朴素贝叶斯分类器,但我的问题是我有混合的分类数据(例如:"在线注册","接受电子邮件通知"等)和连续数据(例如:"年龄","长度")会员资格"等).我之前没有使用scikit,但我认为高斯朴素贝叶斯适用于连续数据,而伯努利朴素贝叶斯可用于分类数据.但是,由于我想在我的模型中同时拥有分类和连续数据,我真的不知道如何处理这个问题.任何想法将不胜感激!
python classification machine-learning data-mining scikit-learn
我是数据分析方面的新手。我正在尝试使用 python 分析数据集。
PassengerId Survived Pclass Sex
0 1 0 3 male
1 2 1 1 female
2 3 1 3 male
3 4 1 1 female
4 5 0 3 male
我试过 groupby() 但它给出了错误。
In[88] titanic_data.groupby('Survived')
Out[88] <pandas.core.groupby.DataFrameGroupBy object at 0x000000000BFFE588>
请提出解决方案