你好,游客 登录
rss订阅 手机访问 
Hadoop
公司的大数据业务为什么都基于Hadoop方案
  现在不管是在国内外的大公司,对于大数据都是非常的渴望,会想尽所有的办法搜集一切的数据,由于现代信息的不对称从而导致不断的数据变化,大量的信息是可以通过数据分析获取。选择Hadoop的原因主要有以下三点:1.降低成本;2.生态圈成熟;3.可以解决问题。
日期:06/25/2014 08:58:37 作者:
当你谈论大数据的时候你还在说Hadoop?
  现在再写这篇文章感觉有些不合时宜,目前,貌似很少人再讨论大数据,也很少人再讨论Hadoop。整理这篇文章,是为了探寻新的技术方向。
日期:11月01日 作者:
一文理解 Apache Hadoop 机架感知
  分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架,由多个机架上的机器共同组成一个分布式集群。
日期:10月30日 作者:
Hadoop集群从180到1500,携程大数据实践之路
  2015年我刚加入携程的时候,它的Hadoop集群规模还仅有约180台,现在已经发展到超过1500台,也就是8倍的提升。同时每天的数据增量在200T以上,调度任务数9万,运行的实例超过18万,其中80%的作业都运行在SparkSQL上。
日期:10月26日 作者:
基于Hadoop的数据分析平台搭建
  企业发展到一定规模都会搭建单独的BI平台来做数据分析,即OLAP(联机分析处理),一般都是基于数据库技术来构建,基本都是单机产品。除了业务数据的相关分析外,互联网企业还会对用户行为进行分析,进一步挖掘潜在价值,这时数据就会膨胀得很厉害,一天的数据量可能会成千万或上亿,对基于数据库的传统数据分析平台的数据存储和分析计算带来了很大挑战。
日期:06月20日 作者:
2018年数据科学和机器学习调查:Python完胜R语言,Hadoop被抛弃!
  近日,数据科学网站KDnuggets发布 2018年数据科学和机器学习工具调查结果。下面一起来看看调查结果
日期:06月07日 作者:
深度:Hadoop对Spark五大维度正面比拼报告!
  每年,市场上都会出现种种不同的数据管理规模、类型与速度表现的分布式系统。在这些系统中,Spark和hadoop是获得最大关注的两个。然而该怎么判断哪一款适合你?
日期:06月07日 作者:
大数据分析系统Hadoop的13个开源工具
  Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。
日期:06月06日 作者:佚名
Hadoop大数据面试题全版本

以下资料来源于互联网,很多都是面试者们去面试的时候遇到的问题,我对其中有的问题做了稍许的修改了回答了部分空白的问题,其中里面有些考题出的的确不是很好,但是也不乏有很好的题目,这些都是基于真实的面试来的,希望对即将去面试或向继续学习hadoop,大数据等的朋友有帮助!

日期:05月23日 作者:
hadoop_eclipse及HDT插件
hadoop_eclipse及HDT插件
日期:05月16日 作者:
Hadoop环境安装和集群创建
Hadoop环境安装和集群创建
日期:05月14日 作者:
基于Hadoop的大数据平台实施——整体架构设计
  大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星。我们暂不去讨论大数据到底是否适用于您的公司或组织,至少在互联网上已经被吹嘘成无所不能的超级战舰。
日期:05月09日 作者:
Hadoop 3.0版本测试,终将计算与存储解耦!
  传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯一途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据中心的网络基础架构不能完成在服务器之间移动大量数据的任务,数据必须与计算机共存。
日期:05月08日 作者:钰莹编译
Hadoop系列:(一)hdfs文件系统的基本操作

可以执行所有常用的Linux文件操作命令(读取文件,新建文件,移动文件,删除文件,列表文件等)

日期:04月27日 作者:
观点:Gartner只是否定Hadoop一体化平台模式
  国内很多人对Hadoop失宠的言论都不屑一顾,认为无非是常规的厂商运作和技术炒作。开篇,我们有必要了解一下整个事件导火索的这篇Gartner报告——《2017年数据管理技术成熟度曲线》,这篇报告指出Hadoop整个堆栈的复杂性与可用性导致企业重新考虑是否将其纳入基础架构规划中
日期:04月27日 作者:钰莹
  • 1/100
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 100
  • »