小编mat*_*ias的帖子

如何从scikit-learn KMeans获取集群中心的文本？

我有一个我用来拟合的字符串列表sklearn.cluster.KMeans:

X = TfidfVectorizer().fit_transform(docs)
km = KMeans().fit(X)

Run Code Online (Sandbox Code Playgroud)

现在我想将聚类中心放在原始字符串表示中.我知道,km.cluster_centers_但无法弄清楚如何获得相关的指数docs.

python machine-learning k-means scikit-learn

mat*_*ias

2012 07-05

6
推荐指数

1
解决办法

4389
查看次数

Python:在多个列表中查找相同的项目

我有一个任意数量的列表列表,例如:

[[1,2,3], [3,4,5], [5,6,7], [7,8,9]]

Run Code Online (Sandbox Code Playgroud)

现在我想要一个包含多个列表中存在的所有元素的列表:

[3,5,7]

Run Code Online (Sandbox Code Playgroud)

我该怎么办？

谢谢!

python list

mat*_*ias

lucky-day

5
推荐指数

3
解决办法

8360
查看次数

Scikits-learn:将自定义词汇与Pipeline一起使用

在我的scikits-learn Pipeline中,我想将自定义词汇表传递给CountVectorizer():

text_classifier = Pipeline([
    ('count', CountVectorizer(vocabulary=myvocab)),
    ('tfidf', TfidfTransformer()),
    ('clf', LinearSVC(C=1000))
])

Run Code Online (Sandbox Code Playgroud)

但是,据我所知,据我所知

text_classifier.fit(X_train, y_train)

Run Code Online (Sandbox Code Playgroud)

Pipeline使用CountVectorizer()的fit_transform()方法,它忽略了myvocab.我怎么能修改我的管道来使用myvocab？谢谢!

python machine-learning scikits scikit-learn

mat*_*ias

2012 06-23

5
推荐指数

1
解决办法

1899
查看次数

Python：将浮动范围 [0.0, 1.0] 映射到颜色范围 [红色、绿色]？

我有一个函数在区间 [0.0, 1.0] 中返回浮点结果。我想使用颜色范围从 0.0 的红色到 1.0 的绿色（可能是 0.5 的黄色）来可视化结果。我怎么能那样做？谢谢！

python colors range

mat*_*ias

lucky-day

5
推荐指数

1
解决办法

5799
查看次数

在 PyML 中获取多类问题的召回（灵敏度）和精度（PPV）值

我正在使用PyML进行 SVM 分类。但是，我注意到当我使用 LOO 评估多类分类器时，结果对象不会报告灵敏度和 PPV 值。相反，它们是 0.0：

from PyML import *
from PyML.classifiers import multi

mc = multi.OneAgainstRest(SVM())
data = VectorDataSet('iris.data', labelsColumn=-1)
result = mc.loo(data)

result.getSuccessRate()
>>> 0.95333333333333337
result.getPPV()
>>> 0.0
result.getSensitivity()
>>> 0.0

Run Code Online (Sandbox Code Playgroud)

我查看了代码，但无法弄清楚这里出了什么问题。有人有解决方法吗？

python classification machine-learning svm pyml

mat*_*ias

lucky-day

1
推荐指数

1
解决办法

2598
查看次数