我想了解如何使用分类数据为特征sklearn.linear_model的LogisticRegression.
我理解当然我需要编码它.
我不明白的是如何将编码特征传递给Logistic回归,以便将其作为分类特征处理,而不是解释编码作为标准可量化特征时获得的int值.
(不太重要)有人可以解释两者的区别preprocessing.LabelEncoder(),DictVectorizer.vocabulary或者只是一个简单的字典编码自己分类数据?Alex A.的评论涉及这个主题,但不是很深刻.
尤其是第一个!
python regression data-modeling scikit-learn logistic-regression
我有一个数据框,我最终要使用 to_excel 方法写入 excel。其中一列代表货币金额。目前它是浮动的,我要完成的是将其写为货币。 但是,重要的是 excel 将列中的数据作为货币而不是字符串读取(例如,您可以对列执行计算)。
无论我尝试什么,excel 都会将该列作为字符串读取。这是我尝试过的:
df['Monetary_Field'] = df['Monetary_Field'].map(lambda x: '$%2.0f' % x)
df['Monetary_Field'] = df['Monetary_Field'].map(lambda x: '${:20,.0f}'.format(x))
df['Monetary_Field'] = df['Monetary_Field'].map('${:,.2f}'.format)
Run Code Online (Sandbox Code Playgroud)
(当然,分别尝试这些,而不是一个接一个)。
你能帮忙吗?谢谢!:)