你好,游客 登录
rss订阅 手机访问 
Hadoop
[译] 图以蔽之:Hadoop在大数据企业应用中的崛起
对于试图分类和整理大数据科技,特别是 Hadoop的那些企业,这是个振奋人心的全新信息图。这个对Hadoop的分析,也许能帮助公司的决策更好地了解该技术平台。
日期:04/07/2015 10:32:17 作者:孙沁,康欣
选择Isilon部署Hadoop的六大优势
介绍
  利用EMC Isilon横向扩展 NAS可以将大数据集聚合到个强大但易于管理的存储平台上,该平台具有强大的可扩展性、很高的性能、的效率以及运营的灵活性,可支持广泛的应程序。本文将为您列举选择Isilon横向扩展NAS进行大数据分析的6大优势。
  更多信息
  Hadoop主要由二个重要组件构成:文件系统(HDFS)和计算系统(MapReduce)。在Hado...
日期:04/03/2015 13:51:13 作者:
不用HDFS能运行Hadoop分析吗
George Crump:简短的回答是你必须有Hadoop分布式文件系统来执行Hadoop分析。但是,通常问这个问题的时候,IT人员实际上想问的是如果存储资源必须直接连接,哪个是传统的Hadoop设计。对于这个问题的答案是NO,而且还有些很有力的理由来佐证我们不必遵从通常的设计。
日期:04/03/2015 13:46:46 作者:
高可用Hadoop平台-实战尾声篇uuu
1.概述
  今天这篇博客就是《高可用Hadoop平台》的尾声篇了,从搭建安装到入门运行 Hadoop 版的 HelloWorld(WordCount 可以称的上是 Hadoop 版的 HelloWorld ),在到开发中需要用到的各个套件以及对套件的安装使用,在到 Hadoop 的实战,路走来我们对在Hadoop平台下开发的基本流程应该都熟悉了。今天我们来完成在高可用Hadoop平台开发的较后步,导出数据。 2....
日期:04/03/2015 13:46:07 作者:哥不是小萝莉
高可用Hadoop平台-实战
1.概述
  今天继续《高可用的Hadoop平台》系列,今天开始进行小规模的实战下,前面的准备工作完成后,基本用于统计数据的平台都拥有了,关于导出统计结果的文章留到后面赘述。今天要和大家分享的案例是个基于电商网站的用户行为分析,这里分析的指标包含以下指标: 统计每日PV 每日注册用户 每日IP 跳出用户
  其他指标可以参考上述4个指标进行拓展,下...
日期:04/03/2015 13:44:48 作者:哥不是小萝莉
说说Hadoop
Hadoop目前我是只看过猪跑,没有吃过猪肉的状态。我在微信和微博上零星地看过些文章,在udacity上 的”Intro to Hadoop and MapReduce”课程上看过几段视频。本想下载安装好Hadoop环境的虚拟机试验下的,结果虚拟机太大,总是出现网络错误不能下载。目前又没有 定要使用Hadoop的项目,也就没有太多动力继续钻研了。不掌握细节可以宏观把握嘛。本着门技术...
日期:04/02/2015 10:26:33 作者:xuhx
Hadoop之后:大数据的未来
在实时数据世界里,为什么我们还这么执着于Hadoop?
  根据451 Research调查数据显示,围绕批处理架构的Hadoop仍然是大数据[注]的代表技术,尽管其声誉仍然超过实际部署情况。
  还没有真正部署Hadoop的企业可能想要再等等。而随着Apache Spark等其他技术(Storm、Kafka等)的出现,我们似乎与Hadoop的批处理渐行渐远,逐渐转向实时数据的未来。
  批处...
日期:04/01/2015 14:07:27 作者:
不只是Hadoop:大数据技术的未来道路
在实时数据的世界当中,我们为什么还要执着于Hadoop这片森林?
日期:03/31/2015 11:24:39 作者:核子可乐译
高可用Hadoop平台-集成Hive HAProxy
1. 首先是些术语的说明。MapReduce作业(job)是客户端执行的单位:它包括输入数据、MapReduce程序和配置信息。Hadoop通过把作业分成若干个小任务(task)来工作,其包括两种类型的任务:map任务和reduce任务。
日期:03/30/2015 11:09:33 作者:董的博客
Hadoop中Partition深度解析
旧版 API 的 Partitioner 解析
Partitioner 的作用是对 Mapper 产生的中间结果进行分片,以便将同分组的数据交给同个 Reducer 处理,它直接影响 Reduce 阶段的负载均衡。旧版 API 中 Partitioner 的类图如图所示。它继承了JobConfigurable,可通过 configure 方法初始化。它本身只包含个待实现的方法 getPartition。 该方法包含三个参数, 均由框架自动传入,...
日期:03/27/2015 11:40:12 作者:
高可用Hadoop平台-运行MapReduce程序
1.概述
   较近有同学反应,如何在配置了HA的Hadoop平台运行MapReduce程序呢?对于刚步入Hadoop行业的同学,这个疑问却是会存在,其 实仔细想想,如果你之前的语言功底不错的,应该会想到自动重连,自动重连也可以帮我我们解决运行MapReduce程序的问题。然后,今天我赘述的是利用 Hadoop的Java API 来实现。    2.介绍
   下面直接附上代码,代码中...
日期:03/26/2015 12:02:10 作者:哥不是小萝莉
为什么出现Hadoop
虽然接触hadoop有了两年多的时间,但是直没有深入地思考过,为什么业界需要这个东西来解决问题?
日期:03/26/2015 12:00:49 作者:tonylee0329
2015年有关Hadoop的10个预测
计算及商业评论杂志给出了2015年Hadoop的10个预测。既包括了企业端的Hadoop(增长率,整合),也包括了技术整合,像Spark vs Hadoop和SQL for Hadoop。
日期:03/23/2015 11:07:20 作者:光光头去打酱油 翻译
深入讲解Hadoop管道
 Hadoop管道是Hadoop MapReduce的C++接口的代称。与流不同,流使用标准输入和输出让map和reduce节点之间相互交流,管道使用sockets作为tasktracker与C++编写的map或者reduce函数的进程之间的通道。JNI未被使用
日期:03/20/2015 11:21:21 作者:吴超Hadoop
  • 96/96
  • «
  • 1
  • ...
  • 95
  • 96