腾讯TDW核心架构由Hive、MapReduce、HDFS及PostgreSQL构成。赵伟分享了最核心的Hive模块在TDW中的实践经验;Hive是一个在hadoop上构建数据仓库的软件,它支持通过类SQL的HQL语言对结构化数据进行操作;实现了基本的SQL功能,可扩充UDF/UDAF、自定义SerDeThrift协议、支持多语言客户端。最后他还剖析了Hive的不足并展望了Hive的发展前景。
相关新闻
数据
|
推荐阅读
|