Hadoop 第80页-@大数据资讯

Hadoop - Kylin On OLAP

　　Apache Kylin是个开源的分布式分析引擎，提供SQL接口并且用于OLAP业务于Hadoop的大数据集上，该项目由eBay贡献于Apache。

[查看全文]

日期：01/05/2016 10:57:32 作者：

【dbdao Hadoop 大数据学习】大数据的动机

　　20多年前的计算机革命使得大量的数据正被企业集聚起来。数字传感器的发展、通信系统的激增，尤其是移动平台和设备;对系统事件大规模的日志记录;以及朝着无纸化企业的迅速发展，这些导致企业内部数据资源的大规模集聚。

[查看全文]

日期：01/04/2016 10:11:20 作者：

Hadoop Serialization hadoop序列化详解(较新版) (1)【java和

Hadoop Serialization hadoop序列化详解(较新版) (1)【java和hadoop序列化比较和writable接口】

[查看全文]

日期：01/04/2016 10:10:17 作者：

CCA Spark and Hadoop 认证技能点【2016只为hadoop达到】

[查看全文]

日期：01/04/2016 09:27:15 作者：

将hadoop的计算和存储分开能有效的提升性能

[查看全文]

日期：12/31/2015 11:07:09 作者：

Hadoop年度回顾与2016发展趋势

[查看全文]

日期：12/31/2015 10:59:25 作者：

Summingbird（Storm + Hadoop）的demo运行

　　为了运行summingbird demo，笔者走了很多的弯路，并且在国内基本上是查阅不到任何的资料，耗时很久才搞定了demo的运行。真的是把辛酸泪，有兴趣想要研究summingbird的园友且听笔者道来，大体可以将summingbird理解为Storm + Hadoop。

[查看全文]

日期：12/29/2015 10:44:50 作者：

Hadoop各个组件的基本原理

　　主要记录了Hadoop各个组件的基本原理，处理过程和关键的知识点等，包括HDFS、YARN、MapReduce等。

[查看全文]

日期：12/28/2015 11:37:12 作者：

Hadoop中的Python框架的使用指南

　　较近，我加入了Cloudera，在这之前，我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的，也是为Java准备的，这让我很恼火。所以，我的头等大事变成了寻找些Python可以用的Hadoop框架。

[查看全文]

日期：12/28/2015 11:35:54 作者：