相关疑难解决方法(0)

scikit-learn中跨多个列的标签编码

我正在尝试使用scikit-learn LabelEncoder来编码DataFrame字符串标签的大熊猫.由于数据框有很多(50+)列,我想避免LabelEncoder为每列创建一个对象; 我宁愿只有一个大LabelEncoder对象适用于我的所有数据列.

投掷整DataFrameLabelEncoder创建下面的错误.请记住,我在这里使用虚拟数据; 实际上我正在处理大约50列字符串标记数据,因此需要一个不按名称引用任何列的解决方案.

import pandas
from sklearn import preprocessing 

df = pandas.DataFrame({
    'pets': ['cat', 'dog', 'cat', 'monkey', 'dog', 'dog'], 
    'owner': ['Champ', 'Ron', 'Brick', 'Champ', 'Veronica', 'Ron'], 
    'location': ['San_Diego', 'New_York', 'New_York', 'San_Diego', 'San_Diego', 
                 'New_York']
})

le = preprocessing.LabelEncoder()

le.fit(df)
Run Code Online (Sandbox Code Playgroud)

回溯(最近一次调用最后一次):文件"",第1行,在文件"/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/preprocessing/label.py",第103行,in y y = column_or_1d(Y,警告=真)文件 "/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/utils/validation.py",线306,在column_or_1d提高ValueError异常("坏输入形状{ 0.".format(shape))ValueError:输入形状错误(6,3)

有关如何解决这个问题的任何想法?

python pandas scikit-learn

192
推荐指数
13
解决办法
14万
查看次数

不能在 corr() 中使用 numeric_only

据我了解,该numeric_only参数在函数中已被弃用corr(),因此它被设置为 false。我有一个数据集,其中一些列不是数字,因此我只想仅这些数字列的相关性。但是,当我写时,corr(numeric_only = True)我收到此类型错误,

类型错误:corr() 得到了意外的关键字参数“numeric_only”

尝试了其他解决方案并检查文档

python pandas

1
推荐指数
1
解决办法
5552
查看次数

标签 统计

pandas ×2

python ×2

scikit-learn ×1