小编mgo*_*kal的帖子

如何找到逻辑回归模型的特征的重要性?

我有一个由逻辑回归算法训练的二元预测模型.我想知道哪些特征(预测因子)对于正面或负面类的决定更重要.我知道有一些coef_参数来自scikit-learn包,但我不知道它是否足够重要.另一件事是我如何coef_根据负面和正面类别的重要性来评估价值观.我还读到了标准化的回归系数,我不知道它是什么.

可以说,有一些特征,如肿瘤的大小,肿瘤的重量等,以决定恶性或非恶性的测试案例.我想知道哪些特征对恶性而非恶性预测更重要.它有道理吗?

python machine-learning scikit-learn logistic-regression

33
推荐指数
1
解决办法
5万
查看次数

Very Large and Very Sparse Non Negative Matrix factorization

我有一个非常大且稀疏的矩阵(531K x 315K),总单元数约为1670亿。非零值仅为1s。非零值的总数约为45K。是否有有效的NMF软件包来解决我的问题?我知道有几个软件包,它们仅适用于较小的数据矩阵。任何想法都可以。提前致谢。

python sparse-matrix bigdata matrix-factorization nmf

3
推荐指数
1
解决办法
2033
查看次数

提取单引号之间的子字符串

我是 python 新手,试图提取单引号之间的子字符串。你知道如何用正则表达式做到这一点吗?

EG输入

 text = "[(u'apple',), (u'banana',)]"
Run Code Online (Sandbox Code Playgroud)

我想提取苹果和香蕉作为列表项,例如['apple', 'banana']

python regex string

2
推荐指数
1
解决办法
6218
查看次数