你好,游客 登录
rss订阅 手机访问 
开源技术
Hadoop大数据面试题全版本

以下资料来源于互联网,很多都是面试者们去面试的时候遇到的问题,我对其中有的问题做了稍许的修改了回答了部分空白的问题,其中里面有些考题出的的确不是很好,但是也不乏有很好的题目,这些都是基于真实的面试来的,希望对即将去面试或向继续学习hadoop,大数据等的朋友有帮助!

日期:今 16:33 作者:
Accordion:HBase “呼吸式”内存压缩算法
现今,HBase 所支持的现代产品对Hbase读写性能的期望越来越高。理想情况下,HBase 也希望在保证其可靠的持久存储的前提下能同时享有内存数据库的速度。
日期:今 11:56 作者:疯子
大数据时代数据库-云HBase架构&生态&实践
  2018第九届中国数据库技术大会,阿里云高级技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBase及生态,最后分享了大数据数据库的实际案例。
日期:昨 13:29 作者:
HIVE和HBASE之间,主要的区别是什么?
  Apache Hive是一个构建在hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。
日期:05月17日 作者:
hadoop_eclipse及HDT插件
hadoop_eclipse及HDT插件
日期:05月16日 作者:
Hadoop环境安装和集群创建
Hadoop环境安装和集群创建
日期:05月14日 作者:
spark 自己的分布式存储系统 - BlockManager
  BlockManager 是 spark 中至关重要的一个组件, 在 spark的的运行过程中到处都有 BlockManager 的身影, 只有搞清楚 BlockManager 的原理和机制,你才能更加深入的理解 spark。
日期:05月10日 作者:
基于Hadoop的大数据平台实施——整体架构设计
  大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星。我们暂不去讨论大数据到底是否适用于您的公司或组织,至少在互联网上已经被吹嘘成无所不能的超级战舰。
日期:05月09日 作者:
Spark SQL 你需要知道的十件事
Spark SQL 你需要知道的十件事
日期:05月09日 作者:
Hadoop 3.0版本测试,终将计算与存储解耦!
  传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯一途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据中心的网络基础架构不能完成在服务器之间移动大量数据的任务,数据必须与计算机共存。
日期:05月08日 作者:钰莹编译
Accordion :一种HBase内存压缩算法
  现如今,人们对基于HBase的产品的读写速度要求越来越高。在理想情况下,人们希望HBase 可以在保证其可靠的持久存储的前提下能并拥有内存数据读写的速度。为此,在HBase2.0中引入Accordion算法。
日期:05月08日 作者:
如何在万亿级别规模的数据量上使用Spark
  Spark作为大数据计算引擎,凭借其快速、稳定、简易等特点,快速的占领了大数据计算的领域。本文主要为作者在搭建使用计算平台的过程中,对于Spark的理解,希望能给读者一些学习的思路。
日期:05月07日 作者:
Apache HBase2.0已经正式发布
  HBase2.0 啥时候发布?好奇宝宝也是期待了很久,曾几何时都把stack问“烦”了,就在2018年4月30日中午,期待已久的HBase 2.0发布啦!
日期:05月07日 作者:
HBase运维基础——元数据逆向修复原理
鉴于上次一篇文章——“云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据”的读者反馈,对HBase的逆向工程比较感兴趣,并咨询如何使用相应工具进行运维等等。
日期:05月03日 作者:
Hadoop系列:(一)hdfs文件系统的基本操作

可以执行所有常用的Linux文件操作命令(读取文件,新建文件,移动文件,删除文件,列表文件等)

日期:04月27日 作者:
  • 1/317
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 317
  • »