你好,游客 登录
rss订阅 手机访问 
Hadoop
公司的大数据业务为什么都基于Hadoop方案
  现在不管是在国内外的大公司,对于大数据都是非常的渴望,会想尽所有的办法搜集一切的数据,由于现代信息的不对称从而导致不断的数据变化,大量的信息是可以通过数据分析获取。选择Hadoop的原因主要有以下三点:1.降低成本;2.生态圈成熟;3.可以解决问题。
日期:06/25/2014 08:58:37 作者:
深入浅出Hadoop之mapreduce
  之前已经作出预告,那么今天就聊聊mapreduce,起源于Google的map reduce paper, 而后经历了mapreduce 1,和构建于yarn上的mapreduce 2,mapreduce1 除了提供一定的历史演变价值和了解一下mapreduce最初的设计之外就没有必要学了哈,毕竟现在意义上的mapreduce2,spark都是在yarn上。
日期:今 14:19 作者:卿哥聊技术
大数据平台 Hadoop 的分布式集群环境搭建
  本文章介绍大数据平台Hadoop的分布式环境搭建、以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1、slave2、slave3中分别部署一个DataNode节点
日期:今 14:18 作者:
大数据的提升:Hadoop即服务的迅猛发展
  云服务已经成为企业加快数字化活动的重要地点,以下便是评估HaaS提供商需要考虑的事项:
日期:昨 10:42 作者:
自建hadoop集群迁移到EMR之数据迁移篇
  自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。
日期:02月02日 作者:
基于Hadoop生态SparkStreaming的大数据实时流处理平台的搭建
  随着公司业务发展,对大数据的获取和实时处理的要求就会越来越高,日志处理、用户行为分析、场景业务分析等等,传统的写日志方式根本满足不了业务的实时处理需求,所以本人准备开始着手改造原系统中的数据处理方式,重新搭建一个实时流处理平台
日期:01月30日 作者:
Hadoop 3.0: YARN Resource自定义资源配置说明
Hadoop 3.0: YARN Resource自定义资源配置说明
日期:01月25日 作者:
分布式计算框架学习笔记--hadoop工作原理
  hadoop是针对大数据设计的一个计算架构。如果你有几百TB的数据需要检索,你在控制终端敲下命令,计算机会向几百分布式台云服务器同时发布命令,使他们开始运行。并且把结果返回给你
日期:01月25日 作者:
Hadoop3.0Yarn添加网络、磁盘IO等资源资料汇总及实战配置遇到的问题和解决办法
  Hadoop3.0扩展Yarn资源,官网给了一些英文资料,这里about云翻译为中文资料。这些资料,还是比较多的,但是在初次阅读的时候,会感到摸不着头脑。但是书读百遍其义自见。下面对这些资料进行汇总。
日期:01月25日 作者:
Hadoop 3.0: YARN Resource自定义资源配置说明
Hadoop 3.0: YARN Resource自定义资源配置说明
日期:01月23日 作者:
大数据处理为何选择Spark,而不是Hadoop
  Spark是一个用来实现快速而通用的集群计算的平台。在速度方面,Spark扩展了广泛使用的MapReduce计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。
日期:01月22日 作者:佚名
零基础学习大数据,搭建Hadoop处理环境
  由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知识介绍。
日期:01月22日 作者:
Hadoop跑满状态下的Yarn资源管理谈
Hadoop跑满状态下的Yarn资源管理谈
日期:01月18日 作者:
Hadoop MapReduce优化和资源调度器
Hadoop MapReduce优化和资源调度器
日期:01月16日 作者:溯水心生
Hadoop单步debug追源码
Hadoop单步debug追源码
日期:01月16日 作者:
  • 1/97
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 97
  • »