小编mgo_kal的帖子

如何找到逻辑回归模型的特征的重要性？

我有一个由逻辑回归算法训练的二元预测模型.我想知道哪些特征(预测因子)对于正面或负面类的决定更重要.我知道有一些coef_参数来自scikit-learn包,但我不知道它是否足够重要.另一件事是我如何coef_根据负面和正面类别的重要性来评估价值观.我还读到了标准化的回归系数,我不知道它是什么.

可以说,有一些特征,如肿瘤的大小,肿瘤的重量等,以决定恶性或非恶性的测试案例.我想知道哪些特征对恶性而非恶性预测更重要.它有道理吗？

python machine-learning scikit-learn logistic-regression

33
推荐指数

1
解决办法

5万
查看次数

Very Large and Very Sparse Non Negative Matrix factorization

我有一个非常大且稀疏的矩阵（531K x 315K），总单元数约为1670亿。非零值仅为1s。非零值的总数约为45K。是否有有效的NMF软件包来解决我的问题？我知道有几个软件包，它们仅适用于较小的数据矩阵。任何想法都可以。提前致谢。

python sparse-matrix bigdata matrix-factorization nmf

3
推荐指数

1
解决办法

2033
查看次数

提取单引号之间的子字符串

我是 python 新手，试图提取单引号之间的子字符串。你知道如何用正则表达式做到这一点吗？

EG输入

 text = "[(u'apple',), (u'banana',)]"

Run Code Online (Sandbox Code Playgroud)

我想提取苹果和香蕉作为列表项，例如['apple', 'banana']

python regex string

2
推荐指数

1
解决办法

6218
查看次数

标签统计

logistic-regression ×1

machine-learning ×1

matrix-factorization ×1

nmf ×1

scikit-learn ×1

sparse-matrix ×1