你好,游客 登录
Hadoop 的搜索结果
  现在再写这篇文章感觉有些不合时宜,目前,貌似很少人再讨论大数据,也很少人再讨论Hadoop。整理这篇文章,是为了探寻新的技术方向。
http://www.thebigdata.cn/Hadoop/37285.html日期:2018/11/1 11:35:28
  分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架,由多个机架上的机器共同组成个分布式集群。
http://www.thebigdata.cn/Hadoop/37280.html日期:2018/10/30 16:12:20
  2015年我刚加入携程的时候,它的Hadoop集群规模还仅有约180台,现在已经发展到超过1500台,也就是8倍的提升。同时每天的数据增量在200T以上,调度任务数9万,运行的实例超过18万,其中80%的作业都运行在SparkSQL上。
http://www.thebigdata.cn/Hadoop/37275.html日期:2018/10/26 17:25:11
  企业发展到定规模都会搭建单独的BI平台来做数据分析,即OLAP(联机分析处理),般都是基于数据库技术来构建,基本都是单机产品。除了业务数据的相关分析外,互联网企业还会对用户行为进行分析,进步挖掘潜在价值,这时数据就会膨胀得很厉害,天的数据量可能会成千万或上亿,对基于数据库的传统数据分析平台的数据存储和分析计算带来了很大挑战。
http://www.thebigdata.cn/Hadoop/37219.html日期:2018/6/20 19:09:12
  每年,市场上都会出现种种不同的数据管理规模、类型与速度表现的分布式系统。在这些系统中,Spark和hadoop是获得较大关注的两个。然而该怎么判断哪款适合你?
http://www.thebigdata.cn/Hadoop/37194.html日期:2018/6/7 14:06:27
  Hadoop是由Apache基金会开发的个大数据分布式系统基础架构,较早版本是2003年原Yahoo!DougCutting根据Google发布的学术论文研究而来。
http://www.thebigdata.cn/Hadoop/37184.html日期:2018/6/6 11:36:46

以下资料来源于互联网,很多都是面试者们去面试的时候遇到的问题,我对其中有的问题做了稍许的修改了回答了部分空白的问题,其中里面有些考题出的的确不是很好,但是也不乏有很好的题目,这些都是基于真实的面试来的,希望对即将去面试或向继续学习hadoop,大数据等的朋友有帮助!

http://www.thebigdata.cn/Hadoop/37119.html日期:2018/5/23 16:33:04
Hadoop学习(二) 第个小练习
http://www.thebigdata.cn/YeJieDongTai/37068.html日期:2018/5/17 11:06:52
hadoop_eclipse及HDT插件
http://www.thebigdata.cn/Hadoop/37058.html日期:2018/5/16 16:22:30
Hadoop环境安装和集群创建
http://www.thebigdata.cn/Hadoop/37038.html日期:2018/5/14 10:51:36
  大数据的热度在持续的升温,继云计算之后大数据成为又大众所追捧的新星。我们暂不去讨论大数据到底是否适用于您的公司或组织,至少在互联网上已经被吹嘘成无所不能的超战舰。
http://www.thebigdata.cn/Hadoop/37006.html日期:2018/5/9 11:40:51
  传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据的网络基础架构不能完成在服务器之间移动大量数据的任务,数据必须与计算机共存。
http://www.thebigdata.cn/Hadoop/37002.html日期:2018/5/8 16:59:14

可以执行所有常用的Linux文件操作命令(读取文件,新建文件,移动文件,删除文件,列表文件等)

http://www.thebigdata.cn/Hadoop/36925.html日期:2018/4/27 15:34:40
  国内很多人对Hadoop失宠的言论都不屑顾,认为无非是常规的厂商运作和技术炒作。开篇,我们有必要了解下整个事件导火索的这篇Gartner报告——《2017年数据管理技术成熟度曲线》,这篇报告指出Hadoop整个堆栈的复杂性与可用性导致企业重新考虑是否将其纳入基础架构规划中
http://www.thebigdata.cn/Hadoop/36922.html日期:2018/4/27 15:19:59
  为了更加方便地对T别的大数据进行批量处理,Hadoop提供了MapReduce这个编程范式。 MapReduce基于分而治冶的思想,将海量数据拆分为大量的小数据块,从而在多个节点并行处理海量数据,较后通过将结果合并以实现高效的批量处理。
http://www.thebigdata.cn/YeJieDongTai/36901.html日期:2018/4/26 14:36:02
  • 1/93
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 93
  • »