小编nit*_*trl的帖子

点子冻结与点子列表

产出比较揭示了差异:

user@user-VirtualBox:~$ pip list
feedparser (5.1.3)
pip (1.4.1)
setuptools (1.1.5)
wsgiref (0.1.2)
user@user-VirtualBox:~$ pip freeze
feedparser==5.1.3
wsgiref==0.1.2

Run Code Online (Sandbox Code Playgroud)

Pip的文档说明

freeze                      Output installed packages in requirements format.
list                        List installed packages.

Run Code Online (Sandbox Code Playgroud)

但是什么是"需求格式",为什么pip list生成比这更全面的列表pip freeze呢？

python pip python-2.7 python-3.x

nit*_*trl

2015 12-19

92
推荐指数

6
解决办法

8万
查看次数

亲和传播偏好参数

我使用 scikit-learn 的亲和传播实现对一组实体名称进行聚类，并使用修改后的 Jaro-Winkler 距离作为相似性度量，取得了令人鼓舞的结果，但我的聚类仍然太多（即误报太多。）

我在 scikit-learn 文档中看到存在一个影响集群数量的“偏好”参数，其描述如下：

偏好：类似数组，形状（n_samples，）或浮点数，可选

每个点的偏好 - 偏好值较大的点更有可能被选为样本。样本的数量，即集群的数量，受输入偏好值的影响。如果偏好不作为参数传递，它们将被设置为输入相似度的中值。[0]

然而，当我开始修改这个值时，我发现一个非常窄的值范围给了我太多的集群 ( preference=-11.13) 或太少的集群 ( preference=-11.11)。

有什么方法可以确定偏好参数的“合理”值应该是多少？为什么我无法获得非极端数量的集群？

类似问题：

亲和传播 - 集群不平衡

亲和传播首选项初始化

python cluster-analysis unsupervised-learning scikit-learn

nit*_*trl

2017 05-23

6
推荐指数

1
解决办法

2211
查看次数

标签统计

python ×2

cluster-analysis ×1

pip ×1

python-2.7 ×1

python-3.x ×1

scikit-learn ×1

unsupervised-learning ×1

点子冻结与点子列表

亲和传播偏好参数

标签 统计

小编nit_trl的帖子

标签统计