小编Irs*_*hat的帖子

聚类十亿个项目(或哪些聚类方法以线性时间运行?)

我有十亿个特征向量,我想把它们放到近似的簇中.以http://scikit-learn.org/stable/modules/clustering.html#clustering中的方法为例,我对它的运行时间如何与数据大小进行比较并不清楚(Affinity Propagation除外)显然太慢了).

哪些方法适合聚类这么大的数据集?我假设任何方法都必须在O(n)时间内运行.

python machine-learning

7
推荐指数
1
解决办法
668
查看次数

Perl如何编译python脚本?

今天我在Python中构建了一个英语语言标记器,我错误地用Perl执行了脚本.我很惊讶地发现Perl实际编译了这个Python代码并给出了正确的结果.

所以我的问题是Perl如何能够编译/解释Python脚本,因为它应该完全不知道编译器/解释器编译/解释代码所需的python语法,语义和所有其他信息?

python perl

1
推荐指数
1
解决办法
385
查看次数

标签 统计

python ×2

machine-learning ×1

perl ×1