你好,游客 登录 注册 搜索
背景:
阅读新闻

大数据架构概览

[日期:2016-02-01] 来源:极客头条  作者: [字体: ]

  Big Data非常复杂,涉及到的技术繁多。我们常“耳闻”的技术,如果MapReduce, Hadoop等处于哪一层次,下图会给你一个整体印象。

  图片:databricks.jpg

大数据

下面是常见的技术简介:

  HBase : 是一个分布式的、面向列的开源数据库。其设计理念源自谷歌的 BigTable,用 Java 语言编写而成。

  MongoDB : 是目前非常流行的一种非关系型(NoSQL)数据库

  YARN : 这是新一代的 MapReduce 计算框架,简称 MRv2,它是在第一代 MapReduce 的基础上演变而来的

  Spark : 是一个基于内存计算的开源的集群计算系统,其目的在于,让数据分析更加快速。Spark 是由加州大学伯克利分校的 AMP 实验室采用 Scala 语言开发而成。Spark 的内存计算框架,适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司均是其用户。

  原文:

 

  https://www.linkedin.com/pulse/100-open-source-big-data-architecture-papers-anil-madan





收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款