这是一个集体智慧的时代.每天,我们创建大约2.5个五分之一字节的数据.据估计,目前世界上90%的数据仅在过去两年内创建.这是我们生成数据的速度!这些数据的新来源日益堆积.
这些来自我们每个人的在线足迹的数据每天都有无数次,用于收集气候信息的各种传感器,我们在社交媒体网站上的帖子,我们的数字图片和视频,短信,在线销售/购买交易记录,手机GPS信号和日常新闻文章为数百万部手机提供服务,仅举几例.这个数据是Bigdata.
但如果我们用纯技术术语说话:
当使用我们的传统数据库管理工具难以存储,搜索,分析,共享给定数量的数据时,大型复杂数据集被称为Bigdata.
业界很快意识到数据挖掘的潜力.因此,分别处理或分析组合的大数据集而不是各种较小的数据集必然会提供更多的见解/趋势/模式.例如,对于出租车代理商的出租车预订的历史数据,可以预测很可能在城市的哪个位置,哪种类型的出租车以及应该在何时停放出租车以供租用!
Bigdata很难通过传统的处理方式处理.它可能需要在数十,数百甚至数千台服务器上运行的大规模并行软件.对于像Google和Apple这样的大型组织来说,设置这样的服务器集群可能是可行的,但它不适合较小的玩家.但随后商品硬件,云架构和社区驱动的开源软件的发展也将Bigdata处理带入了较小的处理范围.对于即使是创业公司来说,Bigdata处理也变得越来越可行,他们可以简单地在云中租用服务器时间,而不是建立自己的服务器房间,而不是.
Bigdata的进步每天都会影响我们!无论是Facebook上的"朋友建议"还是Google上的"个性化广告".行业不断挖掘数据(实际上是The Bigdata),以提供高度个性化的用户体验,同时创建一种新的广告业务,广告商在手边知道您需要购买什么!
那么你去了很多Bigdata的实际例子.
资料来源:bigdataspeak
| 归档时间: |
|
| 查看次数: |
1385 次 |
| 最近记录: |