Che*_*dur 0 ssis data-mining bigdata
我已经阅读了很多文章,但我似乎没有得到关于什么是大数据的完全清楚的答案.在一个页面中,我看到"任何对您的使用来说更大的数据,都是大数据,即100 MB被认为是您邮箱的大数据,而不是您的硬盘".而另一篇文章说"大数据通常超过1 TB,不同的数量/种类/速度,不能存储在一个系统中".此外,该数据应存储在NOSQL数据库中,其中Hadoop用于转换数据.
此外,我一直在研究解决方案,并想知道我是否可以将其归类为大数据.以下解决方案的片段,
任何帮助将非常感激.谢谢 !
大数据只不过是各种各样的庞大而复杂的数据,这些数据在捕获,存储,处理,检索和分析数据时变得非常繁琐.
来自ibmbigdatahub artcile和edureka的文章
Bigdata可以用四个V来定义.
卷:使数据"大"的主要特征是数量庞大.它可能达到数百TB或甚至数PB的信息.例如,15TB的Facebook帖子或4000亿年度医疗记录可能意味着大数据!
速度:速度是指数据在公司中流动的速度.大数据需要快速处理.时间因素在几个组织中起着非常重要的作用.例如,在股票市场处理200万条记录或评估申请竞争性考试的数百万学生的结果可能意味着大数据!
品种:大数据可能不属于特定格式.它可以是任何形式,如结构化,非结构化,文本,图像,音频,视频,日志文件,电子邮件,模拟,3D模型等.
准确性:准确性是指可用数据的不确定性.可用的数据有时会变得混乱并且可能难以信任.对于许多形式的大数据,质量和准确性难以控制
大数据是:
当一个大老板认为这是一个巨大的机会时,因为数据就是新的石油和黄金,并从中获得了一大笔钱,可以扔出一扇窗户并将其冲洗干净。然后,您的数据仓库和孤岛变成了一个数据湖,而充满协同作用的数据湖变成了充满位腐烂的数据沼泽。其中,大视野命中,并非眼前一亮一切都是金的现实。然后,厄运的大门打开,随之而来的是即将破裂的大泡沫。幻灭的桥梁很小,你不会过去,而会跌入深渊在所有无用数据流向何处的情况下,没有计划或目标的情况下,收集,映射和减少数据的热情就会越来越高。答对了!
| 归档时间: |
|
| 查看次数: |
1317 次 |
| 最近记录: |