你好,游客 登录
背景:
阅读新闻

云和大数据没有对数据仓库构成威胁

[日期:2014-06-16] 来源:网界网  作者:美国InfoWorld专栏作家 David Linthicum [字体: ]

  我经常会听到大数据系统的使用将让古老的数据仓库消亡的说法。为什么?因为创建数据仓库需要投入大量资金。考虑一下技术成本,包括价格不菲的硬件与软件,最低限度的采购开销也大大超过了100万美元。

  将大数据转移到云平台上后,用户可以访问别人的硬件,并创建大规模数据存储系统。这些数据存储系统能够使用高分布性询问处理系统,通过分而治之的方法在几分钟甚至几秒钟内从海量数据中获得答案。

  传统的数据仓库通常是利用抽象[注]化数据展开工作。这些抽象化数据会被汇总(用数据仓库的行话来说就是清洗和转换)至独立的数据库(数据仓库或数据集市),以用于提前明确的特定分析(例如合规报告或销售趋势分析)。相同类型的汇总数据会分批更新到数据库中,通常是每周一次或每月一次进行更新。相比之下,大数据系统更注重原始数据,无论这些数据是来自运行(日志报告)、用户活动(网站跟踪)还是其他的实际使用(人口统计调查)。原始数据之所被保留下来,原因在于它们的用途没有被提前明确下来,因此也无法以特定方式对它们进行转换。

  显然,使用大数据系统意味着你拥有更多的当前原始背景信息,而这些信息可以更好地为部门经理和主管提供支持。更重要的是,它们的成本只有传统数据仓库的三分之一或是更少。如果将大数据系统放在公有云[注]上,那么查询所花费的时间将只有原来的十分之一。

  将大数据放在公有云上会带来巨大的改观和明显的收益。如此一来,传统数据仓库的未来是什么样的呢?

  实际的情况是,那些使用数据仓库技术的人将继续干他们的工作。尽管任务正在迅速转移到大数据平台上,但是那些已被部署的系统正在受到更多的关注。大数据系统通常被用于解读战术性问题,例如库存什么时候需要补充,谁没有销售他们的配额等。

  目前企业仍然在报告和可视化方面使用数据仓库,以向主管和监管部门汇报公司的整体业绩。这些报表由花费了数百万美元创建的传统数据仓库系统生成。这些系统不会很快就变得一无是处。无论云上的大数据具有多么出色的费效比,数据仓库在许多企业中仍然无法或缺。这一现状在现有系统的生命周期内会一直持续下去。虽然很奇特,但是这却是我所看到的。





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款