你好,游客 登录
rss订阅 手机访问 
Hadoop
Hadoop - Kylin On OLAP
  Apache Kylin是个开源的分布式分析引擎,提供SQL接口并且用于OLAP业务于Hadoop的大数据集上,该项目由eBay贡献于Apache。
日期:01/05/2016 10:57:32 作者:
【dbdao Hadoop 大数据学习】大数据的动机
  20多年前的计算机革命使得大量的数据正被企业集聚起来。数字传感器的发展、通信系统的激增,尤其是移动平台和设备;对系统事件大规模的日志记录;以及朝着无纸化企业的迅速发展,这些导致企业内部数据资源的大规模集聚。
日期:01/04/2016 10:11:20 作者:
Hadoop Serialization hadoop序列化详解(较新版) (1)【java和hadoop序列化比较和writable接口】
Hadoop Serialization hadoop序列化详解(较新版) (1)【java和hadoop序列化比较和writable接口】
日期:01/04/2016 10:10:17 作者:
CCA Spark and Hadoop  认证技能点【2016只为hadoop达到 】
CCA Spark and Hadoop 认证技能点【2016只为hadoop达到】
日期:01/04/2016 09:27:15 作者:
将hadoop的计算和存储分开能有效的提升性能
将hadoop的计算和存储分开能有效的提升性能
日期:12/31/2015 11:07:09 作者:
Hadoop年度回顾与2016发展趋势
Hadoop年度回顾与2016发展趋势
日期:12/31/2015 10:59:25 作者:
Summingbird(Storm + Hadoop)的demo运行
  为了运行summingbird demo,笔者走了很多的弯路,并且在国内基本上是查阅不到任何的资料,耗时很久才搞定了demo的运行。真的是把辛酸泪,有兴趣想要研究summingbird的园友且听笔者道来,大体可以将summingbird理解为Storm + Hadoop。
日期:12/29/2015 10:44:50 作者:
Hadoop各个组件的基本原理
  主要记录了Hadoop各个组件的基本原理,处理过程和关键的知识点等,包括HDFS、YARN、MapReduce等。
日期:12/28/2015 11:37:12 作者:
Hadoop中的Python框架的使用指南
  较近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它 很棒的科学计算栈 来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找些Python可以用的Hadoop框架。
日期:12/28/2015 11:35:54 作者:
Hadoop Serialization -- hadoop序列化详解 (3)【ObjectWritable,集合Writable以及自定义的Writable】
Hadoop Serialization -- hadoop序列化详解 (3)【ObjectWritable,集合Writable以及自定义的Writable】
日期:12/28/2015 11:34:19 作者:
Hadoop Serialization -- hadoop序列化详解 (2)
Hadoop Serialization -- hadoop序列化详解
日期:12/25/2015 10:18:09 作者:
Hadoop 单节点_伪分布 安装手记
  目的这篇文档的目的是帮助你快速完成单机上的Hadoop安装与使用以便你对Hadoop分布式文件系统(HDFS)和Map-Reduce框架有所体会,比如在HDFS上运行示例程序或简单作业等。
日期:12/25/2015 10:16:55 作者:
Hadoop Yarn内存资源隔离实现原理——基于线程监控的内存隔离方案
  Hadoop Yarn的资源隔离是指为运行着不同任务的“Container”提供可独立使用的计算资源,以避免它们之间相互干扰。目前支持两种类型的资源隔离:CPU和内存,对于这两种类型的资源,Yarn使用了不同的资源隔离方案。
日期:12/24/2015 10:33:17 作者: