你好,游客 登录 注册 搜索
背景:
阅读新闻

超详细的大数据学习资源大全!

[日期:2016-11-23] 来源:简书  作者:w3cschool [字体: ]

  当今社会,可以说进入了大数据时代,爆炸性的数据信息给传统的计算技术以及信息技术带来术挑战。大数据技术正在助力公众、企业打开DT世界的大门。学习大数据不仅前景好,而且工资高。为了帮助程序员更好、更深入的了解大数据,w3cschool整理了GitHub Awesome Big Data资源,供大家参考。本资源类型主要包括:大数据框架、论文等实用资源集合。

  1.关系数据库管理系统(RDBMS)

大数据

  关系数据库管理系统就是管理关系数据库,并将数据组织为相关的行和列的系统。mySQL、SQL Server、PostgreSQL 2、Oracle 数据库等是一个关系数据库管理系统 (RDBMS)。

  2.分布式文件系统

  分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连,也就是集群文件系统,可以支持大数量的节点以及PB级的数量存储。w3cschool资深用户为大家收集的分布式文件系统资源,主要包括Apache HDFS、BeeGFS、Ceph Filesystem、Disco DDFS等。

  3.键-值数据模型

  键值数据库特别面向聚合,也就是说这类数据库主要是通过聚合来构建的。它包含大量聚合,每个聚合中都有一个获取数据所用的键或ID。此部分内容,主要囊括Aerospike、Amazon DynamoDB、ElephantDB、EventStore、GridDB等。

  4.分布式编程

  分布式编程是可在分布计算机系统的几台计算机上同时协调执行的程序设计方法,分布式程序设计的主要特征是分布和通信。采用分布式程序设计方法设计程序时,一个程序由若干个可独立执行的程序模块组成。W3Cschool资深用户为大家收集的分布式编程资源,主要包括AddThis Hydra、AMPLab SIMR、Apache Beam、Apache Crunch、Cascalog等内容。

  5.文件数据模型

  W3Cschool资深用户为大家收集的文件数据模型,虽然内容不多,但是都是精华,主要包括Actian Versant、Crate Data、Facebook Apollo、jumboDB等,都很实用,快去公众号看看吧。

  6.Key -Map 数据模型和框架

  此部分内容,主要囊括Apache Accumulo 、Apache Cassandra 、Apache HBase 等知识。

  框架资源中,W3Cschool资深用户还在收集中,暂时整理好的资源包括Apache Hadoop、Tigon。

 

  上面W3Cschool资深用户为大家收集的大数据学习资源大全,希望能够帮助大家。这部分内容,还在持续整理中。未来社会是大数据时代的社会,大数据开发的前途无限光明,还等什么,赶紧去学习吧!





收藏 推荐 打印 | 录入:elainebo | 阅读: