使用clojure进行大规模数据挖掘

use*_*359 10 clojure data-mining

我正在寻找一个很好的参考

使用Clojure进行大规模数据挖掘

我知道很多好的clojure编程书籍(Programming Clojure,Joy of Clojure,...),以及许多优秀的数据挖掘教科书(挖掘海量数据集,管理千兆字节......).但是我不知道有任何专门针对的引用

使用Clojure进行大规模数据挖掘

由于以下原因,"with clojure"部分对我来说非常重要:

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)
Run Code Online (Sandbox Code Playgroud)

特别是,我认为JVM,Clojure数据结构之间存在很多相互作用,数据是存储在内存中还是懒惰地从磁盘读取 - 可以使"相同"算法的运行时间大不相同"略微"不同的实现.

因此,我的问题(以上所有内容都是为了避免被"Check Google"关闭):

使用Clojure进行大规模数据挖掘的好资源是什么?

谢谢!

mik*_*era 13

我认为还没有人写出一篇很好的综合参考资料.但是在这个领域肯定有很多工作要做(包括我自己的公司!)

一些有趣的后续链接: