你好,游客 登录
rss订阅 手机访问 
开源技术
大数据时代数据库-云HBase架构&生态&实践
  2018第九届中国数据库技术大会,阿里云高技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBase及生态,较后分享了大数据数据库的实际案例。
日期:05月22日 作者:
HIVE和HBASE之间,主要的区别是什么?
  Apache Hive是个构建在hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。
日期:05月17日 作者:
hadoop_eclipse及HDT插件
hadoop_eclipse及HDT插件
日期:05月16日 作者:
Hadoop环境安装和集群创建
Hadoop环境安装和集群创建
日期:05月14日 作者:
spark 自己的分布式存储系统 - BlockManager
  BlockManager 是 spark 中至关重要的个组件, 在 spark的的运行过程中到处都有 BlockManager 的身影, 只有搞清楚 BlockManager 的原理和机制,你才能更加深入的理解 spark。
日期:05月10日 作者:
基于Hadoop的大数据平台实施——整体架构设计
  大数据的热度在持续的升温,继云计算之后大数据成为又大众所追捧的新星。我们暂不去讨论大数据到底是否适用于您的公司或组织,至少在互联网上已经被吹嘘成无所不能的超战舰。
日期:05月09日 作者:
Spark SQL 你需要知道的十件事
Spark SQL 你需要知道的十件事
日期:05月09日 作者:
Hadoop 3.0版本测试,终将计算与存储解耦!
  传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据的网络基础架构不能完成在服务器之间移动大量数据的任务,数据必须与计算机共存。
日期:05月08日 作者:钰莹编译
Accordion : 种HBase内存压缩算法
  现如今,人们对基于HBase的产品的读写速度要求越来越高。在理想情况下,人们希望HBase 可以在保证其可靠的持久存储的前提下能并拥有内存数据读写的速度。为此,在HBase2.0中引入Accordion算法。
日期:05月08日 作者:
如何在万亿 别规模的数据量上使用Spark
  Spark作为大数据计算引擎,凭借其快速、稳定、简易等特点,快速的占领了大数据计算的领域。本文主要为作者在搭建使用计算平台的过程中,对于Spark的理解,希望能给读者些学习的思路。
日期:05月07日 作者:
Apache HBase2.0已经正式发布
  HBase2.0 啥时候发布?好奇宝宝也是期待了很久,曾几何时都把stack问“烦”了,就在2018年4月30日中午,期待已久的HBase 2.0发布啦!
日期:05月07日 作者:
HBase运维基础——元数据逆向修复原理
鉴于上次篇文章——“云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据”的读者反馈,对HBase的逆向工程比较感兴趣,并咨询如何使用相应工具进行运维等等。
日期:05月03日 作者:
Hadoop系列:( )hdfs文件系统的基本操作

可以执行所有常用的Linux文件操作命令(读取文件,新建文件,移动文件,删除文件,列表文件等)

日期:04月27日 作者:
观点:Gartner只是否定Hadoop 体化平台模式
  国内很多人对Hadoop失宠的言论都不屑顾,认为无非是常规的厂商运作和技术炒作。开篇,我们有必要了解下整个事件导火索的这篇Gartner报告——《2017年数据管理技术成熟度曲线》,这篇报告指出Hadoop整个堆栈的复杂性与可用性导致企业重新考虑是否将其纳入基础架构规划中
日期:04月27日 作者:钰莹
Hadoop系列五——HBase简介(续)
  本文是对《 Hadoop系列四——HBase简介 》文的补充,不过本文不会进行系统性介绍,只是针对个个独立的点介绍,并且会不断更新,有点类似于FAQ吧。
日期:04月26日 作者: