你好,游客 登录
背景:
阅读新闻

将你的数据库规模大数据?

[日期:2014-10-13] 来源:http://demo.dianlake.com  作者: [字体: ]

  BI工具都打在许多大企业的数据屋越来越大的作用。他们抱出来,提供最终用户有机会做自助式报表和分析数据的承诺。这可以使业务更加敏感,也腾出昂贵的数据库管理员(DBA)的时间。

  然而,这种自由是有代价的。 BI工具是由他们的性质无约束,从而允许用户请求的数据的几乎任何问题。这地方基础数据库增加紧张,因为这种行为是非常困难的优化。结果,许多企业发现,是一个非常大的硬件投资。而对于这笔费用的原因很简单;关系型数据库技术从来没有在设计这种规模的数据进行操作。

线性可扩展性已不再足够好

  在关系型数据库技术开始出现四十年前它是基于集代数。这是很好的小桌子,但很快就被数据淹没的增长。新的关系数据库技术兴起。这些用于索引和聚集,加快查询和意味着这些数据库将线性扩展的数据增长。

  然而,有一个成本。你不能计算或存储每一个可能的索引或聚集。他们不得不基于的数据库将如何被使用的研究提前分娩的选择。如果这是错误的,或者新的需求出现,则整个设计会受到影响,表现会很快变得不可接受。

  当然,如果要求是连接到一个商业智能工具,我们可以被击败之前,我们甚至开始因为这些工具的用户的行为是如此的难以预料。所有主要的厂商今天提供的内存版本的产品。然而,这些依然在内存中的版本的关系数据库,其性能与数据大小成线性关系。把足够多的数据对他们和他们要么用完时或运行内存。

尝试生活模式数据库,而不是

  最近,一个新类型的数据库已经发展 – 生活模式数据库。这种类型的数据库没有存储的行或列中的数据,而是考虑行是在模式的生存空间的一个点。模式可以被构造为简单的可能值的集合为字段或更复杂的图案,其它模式的组合,或者是由一个共同的属性链接模式组。

  在模式空间中的所有数据的存在,但它不再是在一个固定的结构持有。当它的时间来查询数据时,生活模式的数据库不直接运行它被赋予的查询,而不是它把查询到的模式空间的等价性,那么如果该属性保存测试。此外,该模式空间将响应接收由进化的请求;通过预测基于过去的历史要求增加新的模式。这些新的模式将通过减少计算他们需要的量加速将来的查询。

  这是不可能的,任何一个IT部门知道的一切,并利用外部专家是做生意的成本。

  那么,什么是收获?就像聚集和指数有可能的模式集无限多的,所以哪些应该在内存中举行?此时生活模式的数据库出现的美女之一;其模式空间也不是一成不变的,而是活的和不断变化的。

  多地开工建设信息安全产业化基地,重复建设现象严重,或引发投资过热。

  即投入的图案空间中的每个模式集被标记为两个值,它们是一组,并计算它的成本的年龄。两者都是以毫秒计。年龄实际测量它有多长,因为设定的最后一次访问,所以它会被重置每个用户使用它来回答查询时间为零。当模式空间开始变得充满了空间的扑杀将发生,从而消除了最古老和最便宜的方式设置第一。这最大限度地减少了扑杀的用户响应时间的影响。

  这工作,因为时间解决所需要的模式集存在一个查询很短(毫秒级),有大量空闲内核和周期维护模式空间的过程。例如,在一家大型零售商这种类型的数据库支持4000个用户查询8十亿行的销售交易数据和亚秒级的响应时间还没有整体解决方案的硬件成本低于30000英镑运行。

结论

  大数据提出了前所未有的挑战,以无约束的商业智能查询世界。它不仅是一个查询的规模的情况下,线性不再是足够的,但也触发这些查询的是IT团队,保持了系统的控制之外。

  BI工具的性能是由性能和底层数据库的具体优化这些查询的能力的限制。虽然很多BI工具来用,这对于工具优化自己的数据存储,这些店不具有可扩展到尺寸比数百万行的10S大。

  线性可扩展性已不再是预测数据生长的脸不够好。为了有效地使用这些工具,你需要一个数据库的响应时间比线性好。这样的性能是不可能的,如果数据库本身是因为确定哪些值将事先与BI工具交互的用户被要求是不可能的静电。因此,一个生活模式的数据库,是灵活和不断重组其模式空间,就像你的大脑管理内存,提供部署了最好的现代BI工具对,我们将会在未来遭遇巨大的数据集的方法





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款