你好,游客 登录 注册 搜索
背景:
阅读新闻

对于大数据来说存储是必须的吗?

[日期:2014-03-12] 来源:畅享网  作者:程浩译 [字体: ]

  关于大数据的讨论往往聚焦在将大量数据进行存储,然后再进行回顾式的分析。而存储又带来了新的问题,诸如数据如何存储、数据如何组织、怎样清洗数据以及怎样的时间划分是合适的。

  尽管这些基于存储的问题解决了,分析师还要决定哪些数据是已经过期了的。它们可能已经过时了,不能够用来反映当前环境了,有些历史数据是不能给我们一个关于未来的视角的。

  实时数据分析

  换一个思路,我们可以选择进行实时大数据分析。这样的话,我们就不用考虑大规模存储相关的问题了,而改为关心商业数据流量带宽了。Jeff Bertolucci在Information Week上面写道,电信公司最早开始使用实时大数据分析来了解当前的网络状况。“先存储,后分析”的方法,在要求实时性的领域中作用可能就不大了。

  尽管中小企业可能没有像电信公司那么大量的数据流,但是他们也应当在投资数据存储之前,先知道它们需要哪些商业数据。Mary Shacklett在Tech Republic上面的一篇文章中提到,清理历史数据,然后得出有用的结果的花费很可能已经超出中小企业的预算承受范围了。从过去中反思学习的确是好的,但是对于中小企业而言,这样的投资得到的数据分析质量的确还是存疑的。

  实时分析的好处

  IT专家应当推荐企业走向实时之路,而不要陷入无尽的数据清理之中。实时分析之中往往见效很快,中小企业短时间内就能看到数据分析的好处;而用传统方式大规模存储,企业要投入很多资金。实时分析方法还有一个好处,就是让中小企业能够了解到哪些商业数据是需要的,因为毕竟不是所有的数据流都要用到商业分析之中。

  通过对数据流的检验,中小企业能够看出哪些是有必要进行存储并回顾的。数据可以在源头就得到了优化。

  要知道,洞察力来自于对数据的了解,而不在于你存储了多少数据。





收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款