小编mat*_*ias的帖子

如何从scikit-learn KMeans获取集群中心的文本?

我有一个我用来拟合的字符串列表sklearn.cluster.KMeans:

X = TfidfVectorizer().fit_transform(docs)
km = KMeans().fit(X)
Run Code Online (Sandbox Code Playgroud)

现在我想将聚类中心放在原始字符串表示中.我知道,km.cluster_centers_但无法弄清楚如何获得相关的指数docs.

python machine-learning k-means scikit-learn

6
推荐指数
1
解决办法
4389
查看次数

Python:在多个列表中查找相同的项目

我有一个任意数量的列表列表,例如:

[[1,2,3], [3,4,5], [5,6,7], [7,8,9]]
Run Code Online (Sandbox Code Playgroud)

现在我想要一个包含多个列表中存在的所有元素的列表:

[3,5,7]
Run Code Online (Sandbox Code Playgroud)

我该怎么办?

谢谢!

python list

5
推荐指数
3
解决办法
8360
查看次数

Scikits-learn:将自定义词汇与Pipeline一起使用

在我的scikits-learn Pipeline中,我想将自定义词汇表传递给CountVectorizer():

text_classifier = Pipeline([
    ('count', CountVectorizer(vocabulary=myvocab)),
    ('tfidf', TfidfTransformer()),
    ('clf', LinearSVC(C=1000))
])
Run Code Online (Sandbox Code Playgroud)

但是,据我所知,据我所知

text_classifier.fit(X_train, y_train)
Run Code Online (Sandbox Code Playgroud)

Pipeline使用CountVectorizer()的fit_transform()方法,它忽略了myvocab.我怎么能修改我的管道来使用myvocab?谢谢!

python machine-learning scikits scikit-learn

5
推荐指数
1
解决办法
1899
查看次数

Python:将浮动范围 [0.0, 1.0] 映射到颜色范围 [红色、绿色]?

我有一个函数在区间 [0.0, 1.0] 中返回浮点结果。我想使用颜色范围从 0.0 的红色到 1.0 的绿色(可能是 0.5 的黄色)来可视化结果。我怎么能那样做?谢谢!

python colors range

5
推荐指数
1
解决办法
5799
查看次数

在 PyML 中获取多类问题的召回(灵敏度)和精度(PPV)值

我正在使用PyML进行 SVM 分类。但是,我注意到当我使用 LOO 评估多类分类器时,结果对象不会报告灵敏度和 PPV 值。相反,它们是 0.0:

from PyML import *
from PyML.classifiers import multi

mc = multi.OneAgainstRest(SVM())
data = VectorDataSet('iris.data', labelsColumn=-1)
result = mc.loo(data)

result.getSuccessRate()
>>> 0.95333333333333337
result.getPPV()
>>> 0.0
result.getSensitivity()
>>> 0.0
Run Code Online (Sandbox Code Playgroud)

我查看了代码,但无法弄清楚这里出了什么问题。有人有解决方法吗?

python classification machine-learning svm pyml

1
推荐指数
1
解决办法
2598
查看次数