你好,游客 登录 注册 搜索
背景:
阅读新闻

一张图回顾Hadoop十年–信息图

[日期:2016-02-02] 来源:199it  作者: [字体: ]

  一张图回顾 Hadoop 十年: Hadoop 老矣,尚能饭否 ?

  Hadoop ,十岁生日快乐 !

  于 2006 年 1 月 28 日诞生的它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。在此为大家梳理 Hadoop 这十年的变化,以及技术圈的生态状况,为 Hadoop“ 庆生 ” 。

  一张图回顾 Hadoop 十年

Hadoop

  1 、引子什么是大数据 ?

  大数据指的是规模超过现有数据库工具获取、存储、管理和分析能力的数据集,并同时强调并不是超过某个特定数量级的数据集才是大数据。

  ——by 麦肯锡《大数据:创新、竞争和生产力的下一个前沿领域》

  大数据的定义聚焦在 “ 大 “ 。从表面上看,数据规模的增长的确为处理数据带来了很大的问题。具体来说,在同样时间内获取与以前相同价值的数据变得不可为了。换言之,本质问题是数据的价值密度变低了,数据交换速率变慢了,所以催生了很多新型数据处理技术和工具,如 Google 的 GFS 和 MapReduce , Apache Hadoop 生态系统,美国伯克利大学 AMPLab 的 Spark 等 ; 出现了对时间敏感程度不同的计算模式,如批式计算模式、交互式计算模式、流计算模式、实时计算模式等。计算模式的差异只是决定获取价值的技术不同,取决于上层业务需求的不同。

 

  实际上,所谓大数据问题的本质应是数据的资产化和服务化,而挖掘数据的内在价值是研究大数据的最终目标。





收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款