准备与大数据相关的设计和架构问题的最佳方法

one*_*ary 5 algorithm bigdata data-structures

最近,我参加了一家公司的现场采访,我被问到与大数据有关的设计问题,例如:在时间t1和t2之间获取访问网站(比如google)的用户列表.使用什么数据结构,如何处理并发,陈旧数据,存储数据需要多少台服务器,以及每台服务器的要求(软件,硬件等)......

请指出一些书籍/网络参考,以增加我在这个新领域的知识.同时向我提供有关如何回答此类设计问题的见解

and*_*oke 3

这本书(免费下载)(亚马逊:海量数据集的挖掘)刚刚发布到HN(该线程也有一些有用的评论) - 从第一次浏览来看,它看起来非常好。你可以读一下。