你好,游客 登录
背景:
阅读新闻

Hadoop生态图

[日期:2014-06-30] 来源:“左罗CTO” 博客  作者:左罗CTO [字体: ]

  

  hadoop已经成长为一个庞大的体系,只要和海量数据相关的领域都能看到Hadoop的身影,以下是Hadoop生态系统中出现的各种数据工具。

  1、这一切,都起源自Web数据爆炸时代的来临

  2、数据抓取系统:Nutch

  3、海量数据怎么存,当然是用分布式文件系统:HDFS

  4、数据怎么用呢,分析,处理

  5、MapReduce框架,让你编写代码来实现对大数据的分析工作

  6、非结构化数据(日志)收集处理:fuse/webdav/chukwa/flume/Scribe

  7、数据导入到HDFS中,至此RDBSM也可以加入HDFS:Hiho、sqoop

  8、MapReduce太麻烦,让你用熟悉的方式来操作Hadoop里的数据:Pig,Hive,Jaql

  9、让你的数据可见:drilldown,Intellicus

  10、用高级语言管理你的任务流:oozie,Cascading

  11、Hadoop当然也有自己的监控管理工具:Hue、karmasphere、eclipse plugin、cacti、ganglia

  12、数据序列化处理与任务调度:Avro、Zookeeper

  13、更多构建在Hadoop上层的服务:Mahout、Elastic map Reduce

  14、OLTP联机事务处理系统:Hbase

  本文出自 “左罗CTO” 博客,请务必保留此出处http://zorro.blog.51cto.com/2139862/1432215





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款