小编Ste*_*n D的帖子

聚类余弦相似度矩阵

有关stackoverflow的一些问题提到了这个问题,但我还没有找到具体的解决方案.

我有一个方形矩阵,由余弦相似性(0到1之间的值)组成,例如:

  |  A  |  B  |  C  |  D
A | 1.0 | 0.1 | 0.6 |  0.4
B | 0.1 | 1.0 | 0.1 |  0.2
C | 0.6 | 0.1 | 1.0 |  0.7
D | 0.4 | 0.2 | 0.7 |  1.0
Run Code Online (Sandbox Code Playgroud)

方阵可以是任何尺寸.我想获得最大化集群中元素之间的值的集群(我不知道有多少).即上面的例子我应该得到两个集群:

  1. A,C,D

原因是因为C&D在它们之间具有最高价值,而A&C也具有它们之间的最高价值.

项目只能位于一个群集中.

召回对于这个问题并不重要,但精确度非常重要.输出三个簇是可以接受的:1)B,2)A,3)C,D.但是输出任何其中B与另一个元素在一个簇中的解决方案是不可接受的.

我认为对角线(1.0)令我感到困惑.我的数据保证至少有一个2+元素的集群,我想在不牺牲精度的情况下找到尽可能多的集群.

我将不得不在Python中实现它.

python math cluster-analysis data-mining scikit-learn

16
推荐指数
1
解决办法
1万
查看次数

Celery任务可以重启吗?

我需要构建一个处理两种类型任务的系统.一种类型可以创建更多自己或另一种类型的任务.工人很少(2-3),只有一个主人.最重要的要求是系统应该优雅地处理重新启动:即在重新启动时,正在进行的任务应该从头开始,工作人员应该选择在重新启动之前排队的任务.看看芹菜它似乎适合这个用例.但是,我有几个问题:

1)Celery能否按照描述处理整个系统的重启?(芹菜+工人+经纪人,一切都重新启动,完全停电).

2)在这种情况下使用的最佳代理是什么?我更喜欢SQLAlchemy + SQLite,因为它更"自包含",但如果RabbitMQ是正确的选择,考虑到要求优雅地处理完全重启,那么我可以继续使用它.

celery

9
推荐指数
1
解决办法
2731
查看次数

如何在 Angular 2 中获取页面主机名?

我需要在 Angular 2 中获取页面的子域,因为它与路由相关。我看到在多次中断发布后,Angular 2 中的路由器服务仍然没有域的概念。同样,Location 服务不知道 URL 的主机部分。

angular2-routing

4
推荐指数
1
解决办法
1万
查看次数

SSH远程端口转发指定接口

我使用它通过SSH隧道进行远程端口转发:

ssh root @ XXXX -R 443:127.0.0.1:443

这绑定到0.0.0.0:443并转发到127.0.0.1:443.

远程服务器有多个IP.是否可以指定要绑定的IP,例如10.10.10.1:443,而不是绑定到所有接口?

iptables在远程服务器上不可用.

ssh openssh tunneling ssh-tunnel

2
推荐指数
1
解决办法
3167
查看次数