Apache Kylin是个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。
日期:01/05/2016 10:57:32
作者:
20多年前的计算机革命使得大量的数据正被企业集聚起来。数字传感器的发展、通信系统的激增,尤其是移动平台和设备;对系统事件大规模的日志记录;以及朝着无纸化企业的迅速发展,这些导致企业内部数据资源的大规模集聚。
日期:01/04/2016 10:11:20
作者:
Hadoop Serialization hadoop序列化详解(较新版) (1)【java和hadoop序列化比较和writable接口】
日期:01/04/2016 10:10:17
作者:
CCA Spark and Hadoop 认证技能点【2016只为hadoop达到】
日期:01/04/2016 09:27:15
作者:
为了运行summingbird demo,笔者走了很多的弯路,并且在国内基本上是查阅不到任何的资料,耗时很久才搞定了demo的运行。真的是把辛酸泪,有兴趣想要研究summingbird的园友且听笔者道来,大体可以将summingbird理解为Storm + Hadoop。
日期:12/29/2015 10:44:50
作者:
主要记录了Hadoop各个组件的基本原理,处理过程和关键的知识点等,包括HDFS、YARN、MapReduce等。
日期:12/28/2015 11:37:12
作者:
较近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它 很棒的科学计算栈 来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找些Python可以用的Hadoop框架。
日期:12/28/2015 11:35:54
作者:
Hadoop Serialization -- hadoop序列化详解 (3)【ObjectWritable,集合Writable以及自定义的Writable】
日期:12/28/2015 11:34:19
作者:
Hadoop Serialization -- hadoop序列化详解
日期:12/25/2015 10:18:09
作者:
目的这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等。
日期:12/25/2015 10:16:55
作者:
Hadoop Yarn的资源隔离是指为运行着不同任务的“Container”提供可独立使用的计算资源,以避免它们之间相互干扰。目前支持两种类型的资源隔离:CPU和内存,对于这两种类型的资源,Yarn使用了不同的资源隔离方案。
日期:12/24/2015 10:33:17
作者:
|
Digg排行
本周热门内容
|