你好,游客 登录
背景:
阅读新闻

如何选择数据可视化产品

[日期:2014-05-14] 来源:36大数据  作者:小六子 [字体: ]

  大数据的核心不是“大”,也不是“数据”,而是蕴含在其中的商业价值。作为挖掘数据背后潜在价值的重要手段,商业智能和分析平台成为大数据部署中的关键环节。然而,获取价值的难点并不在于数据分析应用的部署,而在于专业数据分析人才的缺乏。市场研究机构IDC甚至认为,数据分析人才的欠缺可能会成为影响大数据市场发展的重要因素。

  “让每个人都成为数据分析师”是大数据时代赋予的要求,数据可视化的出现恰恰从侧面缓解了专业数据分析人才的缺乏。Tableau、Qlik、Microsoft、SAS、IBM等IT厂商纷纷加入数据可视化的阵营,在降低数据分析门槛的同时,为分析结果提供更炫的展现方式。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一话题展开,希望能对正在选型中的企业有所帮助。

  一、数据可视化概述

  数据可视化是技术与艺术的完美结合,它借助图形化的手段,清晰有效地传达与沟通信息。一方面,数据赋予可视化以意义;另一方面,可视化增加数据的灵性,两者相辅相成,帮助企业从信息中提取知识、从知识中收获价值。

  维基百科对数据可视化的定义较为权威,它认为数据可视化是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。

  1.发展历史

  数据可视化的历史可以追溯到二十世纪50年代计算机图形学的早期,人们利用计算机创建出了首批图形图表。到了1987年,一篇题为《Visualization in Scientific Computing(科学计算之中的可视化,即‘科学可视化’)》的报告成为数据可视化领域发展的里程碑,它强调了新的基于计算机的可视化技术方法的必要性。

  随着人类采集数据种类和数量的增长,以及计算机运算能力的提升,高级的计算机图形学技术与方法越来越多的应用于处理和可视化这些规模庞大的数据集。二十世纪90年代初期,“信息可视化”成为新的研究领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析工作提供支持。

  当前,数据可视化是一个既包含科学可视化,又包含信息可视化的新概念。它是可视化技术在非空间数据上新的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及数据之间的结构关系。

  2.市场调查

  在2014年3月进行了一项有关数据可视化的调查,从中可以看出,当前已经部署数据可视化的企业仅为15%,但有56%的企业计划1-2年内部署相关应用。从企业部署可视化的目的来看,排在前三位的分别为:通过可视化发现数据的内在价值(36%)、满足高层领导的决策需要(30%)和满足业务人员的分析需要(25%),仅有9%的企业选择需要更美观的展现效果。

数据可视化

  在针对Tableau、Qlik、Tibco software、SAS、Microsoft、SAP、IBM和Oracle八家数据可视化产品和服务提供商的调查中,笔者分别从知名度、流行度和领导者三个角度进行分析。从知名度来看,八家厂商几乎不分先后,只有微小的差距;从流行度来看,SAP、IBM和SAS占据前三位,所在比例分别为19%、18%和17%;从领导者来看,Tableau以40%的优势遥遥领先,这与2014年Gartner的魔力象限排名也非常吻合。

  3.技术趋势

  数据可视化的思想是将数据库中每一个数据项作为单个图元元素,通过抽取的数据集构成数据图像,同时将数据的各个属性值加以组合,并以多维数据的形式通过图表、三维等方式用以展现数据之间的关联信息,使用户能从不同的维度以及不同的组合对数据库中的数据进行观察,从而对数据进行更深入的分析和挖掘。

  传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

  (1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

  (2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

  (3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

  (4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

  4.专家观点

  中国传媒大学新闻学院沈浩教授:随着非结构和半结构化数据的增长,数据可视化的发展需要迎合多类型的数据,词云、泡泡图、热图等形式的出现更加贴合新的数据类型。另外,在展现形式上,数据可视化工具还应该满足直接发布到云端、移动端的需求。

  阿里巴巴数据平台事业部资深开发工程师宁朗:数据可视化是大数据和大智慧之间的桥梁,大数据将数据变为设计师,每个人都可以利用。

  Splunk中国区高级售前工程师崔玥:数据可视化重新定义了数据分析,如同Windows重新定义了操作系统,它将数据从晦涩的代码中脱离出来,通过简单的图形界面和大众更易接受的方式,提供一个展现、监控数据的平台,让数据分析工作更简单。

  QlikView南北亚区售前经理张子斌:数据可视化利用人类发现复杂数据中的异常、模式、趋势甚至相关性的天然能力,这是我们无法用数据的行和列做到的。好的数据可视化伴随有内存中的关联技术、移动和社交商业探索能力,能让使用者自由、高效地挖掘数据以找出重要规律并做出时间关键的决策。

  企业获取数据可视化功能主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是Processing.js,它是为艺术家提供的编程语言。从统计和数据处理的角度,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形处理。介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择。像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款