你好,游客 登录
rss订阅 手机访问 
HBase
深入HBase架构解析(2)
  通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在起,甚至删除个Cell也只是写入个新的Cell,它含有Delete标记,而不定将个Cell真正删除了,因而这就引起了个问题,如何实现读的问题?要解决这个问题,我们先来分析下相同的Cell可能存在的位置
日期:09/24/2015 10:13:12 作者:
深入HBase架构解析(1)
  公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章: An In-Depth Look at the HBase Architecture ,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译、半原创吧。
日期:09/24/2015 10:08:34 作者:
HBase 数据导入功能实现方式解释
HBase 数据导入功能实现方式解释
日期:09/23/2015 10:56:31 作者:
HBase vs. MongoDB vs. MySQL vs. Oracle vs. Redis,三大主流开源 NoSQL 数据库的 PK 两大主流传...
HBase vs. MongoDB vs. MySQL vs. Oracle vs. Redis,三大主流
日期:09/16/2015 10:45:01 作者:
实现Hbase的分页
  做个项目中由于数据量比较大,并且需要定时增量分析,做了hbase的分页。项目中用到的版本是hbase1.1 。需要启用协处理器 Aggregation
日期:09/02/2015 11:22:18 作者:
SparkStreaming向Hbase中写数据( )
SparkStreaming向Hbase中写数据
日期:08/26/2015 10:19:01 作者:
深入HBase架构解析( )
  通过前文的描述,我们知道在HBase写时,相同Cell(RowKey/ColumnFamily/Column相同)并不保证在起,甚至删除个Cell也只是写入个新的Cell,它含有Delete标记,而不定将个Cell真正删除了,因而这就引起了个问题,如何实现读的问题?要解决这个问题
日期:08/24/2015 10:07:33 作者:
浅谈zookeeper的在hbase集群中的作用
  ZooKeeper 顾名思义 动物园管理员,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig) 的管理员, Apache Hbase和 Apache Solr 以及LinkedIn sensei 等项目中都采用到了 Zookeeper。ZooKeeper是个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper是以Fast Paxos算法为基础,实现同步服务,配置维护和命名服务等分布式应用。
日期:08/21/2015 10:39:49 作者:
创建hive整合HBase的表总结
创建hive整合HBase的表总结
日期:08/21/2015 10:37:15 作者:
HBase 数据库检索性能优化策略
  HBase 数据库是个基于分布式的、面向列的、主要用于非结构化数据存储用途的开源数据库。其设计思路来源于 Google 的非开源数据库”BigTable”。
日期:08/20/2015 10:33:57 作者:
HBase中MVCC的实现机制及应用情况
MVCC(Multi-Version Concurrent Control),即多版本并发控制协议,广泛使用于数据库系统。本文将介绍HBase中对于MVCC的实现及应用情况。 MVCC基本原理
日期:08/13/2015 17:09:28 作者:
HBase客户端API基本操作
Java类与HBase数据模型
HBaseConfiguration
包名 : org.apache.hadoop.hbase.HBaseConfiguration
作用:对HBase进行配置。
用法示例:
HBaseConfiguration hconfig = new HBaseConfiguration(); hconfig.set("hbase.zookeeper.property.clientPort","2181"); 1 2
HBaseAdmin
包名 : org.apache.hadoop.hbase.client.HBaseAdmin ...
日期:07/03/2015 15:54:55 作者:翼宇轩
关于HBase的 些低碎事
随着Facebook使用HBase来构建实时消息系统,基于Hadoop的面向列存储的HBase持续升温。
日期:06/29/2015 17:06:29 作者:
基于HBase构建可伸缩的分布式事务队列
个实时流处理框架通常需要两个基础架构:处理器和队列。处理器从队列中读取事件,执行用户的处理代码,如果要继续对结果进行处理,处理器还会把事件写到另外个队列。队列由框架提供并管理。队列做为处理器之间的缓冲,传输数据和事件,这样处理器可以单独操作和扩展。例如,个web 服务访问日志处理应用,可能是这样的:
日期:06/25/2015 11:13:29 作者:Terence Yim
HBase在腾讯大数据的应用实践
出处:微信公众号_腾讯大数据(tencentbigdata)
  前言
  随着腾讯产品与技术的发展,几乎任何个与用户相关的在线业务的数据量都在亿别,每日系统调用次数从亿到百亿,对海量数据的高效插入和快速读取变得越来越重要。而传统关系型数据库模式固定、强调参照完整性、数据的逻辑与物理形式相对独立等,比较适用于中小规模的数据,但对于数据的规模和并发读写...
日期:06/05/2015 11:22:09 作者:小林子