我有一个由逻辑回归算法训练的二元预测模型.我想知道哪些特征(预测因子)对于正面或负面类的决定更重要.我知道有一些coef_
参数来自scikit-learn包,但我不知道它是否足够重要.另一件事是我如何coef_
根据负面和正面类别的重要性来评估价值观.我还读到了标准化的回归系数,我不知道它是什么.
可以说,有一些特征,如肿瘤的大小,肿瘤的重量等,以决定恶性或非恶性的测试案例.我想知道哪些特征对恶性而非恶性预测更重要.它有道理吗?
我有一个非常大且稀疏的矩阵(531K x 315K),总单元数约为1670亿。非零值仅为1s。非零值的总数约为45K。是否有有效的NMF软件包来解决我的问题?我知道有几个软件包,它们仅适用于较小的数据矩阵。任何想法都可以。提前致谢。
我是 python 新手,试图提取单引号之间的子字符串。你知道如何用正则表达式做到这一点吗?
EG输入
text = "[(u'apple',), (u'banana',)]"
Run Code Online (Sandbox Code Playgroud)
我想提取苹果和香蕉作为列表项,例如['apple', 'banana']