你好,游客 登录 注册 搜索
背景:
阅读新闻

大数据翻转商业价值 越快发现错误就越快成功

[日期:2015-04-29] 来源:中国大数据  作者: [字体: ]

大数据

    建议互联网分析人员用尝试错误的方式来找出数据价值。一旦分析人员有了新发现,立即就要丢进市场测试水温,如此才有办法确定新发现有没有价值。愈快发现错误就代表愈快成功,不断地从错误中淬炼,才能找出数据黄金。

    看重互联网所能造就的影响力,自2011年Big Data一词兴起以来,如何从大量且庞杂数据找出商业价值,就成为众所瞩目的焦点。这个继云计算之后,另一个被视为为IT带来变革的概念,正快速地迈开发展的脚步,不仅解决方案纷呈,全球企业也争相投入。

    然而,互联网并非全然美好,至少在现今仍有成本过高,企业存在实际应用的困难;数据太过庞杂,无法从中找出正确的洞见与方针;互联网分析还是一个陌生领域,分析人员普遍存在专业技能不足或是企业人才缺乏等问题。

    从事技术顾问辅导企业多年,Teradata台湾分公司资深技术顾问郭柏森坦承,现今台湾真正导入互联网分析平台的企业并不多,最先愿意尝试的产业主要是电子商务领域。因独特的产业条件,先天上就不是采用与顾客面对面交易的策略,因而在网站或交易系统的设计方面,就会想方设法收集客户所有资讯,「这是电子商务行业所具备的优势,一开始就带有收集资讯的基因,不管是在思维以及实际导入应用,都比其他行业的脚步要来得快些。」

    分析客户行为与观感

    ▲Teradata台湾分公司资深技术顾问郭柏森提到,仅仅只收集交易型数据已经不足,企业还要关注使用者在网站、App上的使用行为,进一步找出市场。

    从数据中萃取出企业营运商业智慧并不是一个崭新的概念。过往商业智慧(Business Intelligence)、数据仓储(Data Warehouse)也藉由分析所有顾客往来的交易数据,企望能对公司的决策者提出一个具有整体视野的建议,以促进决策的制定,创造更好的营收。

    不过,商业智慧或是数据仓储所分析的数据型态都属於交易型数据,像是银行卡费、贷款、保单等等可透过关联式数据库进而分析的资讯,这种结构化的数据与现今所论及的互联网分析,就数据的形态的包容性上就有明显的区隔。

    郭柏森解释,互联网有三V,Volume(量)、Velocity(速度)以及Variety(多样性),其中多样性即是包括语音、文字、影像以及图片等非结构化数据。简单地说,互联网包含了结构化与非结构化的数据,这两种不同的数据型态,同时都会被纳入分析的范畴。

    「许多因素造就了互联网环境,例如使用者行为改变也是原因之一。你可能很久没有临柜交易,但银行的网站以及交易却从来没有中断过。过往金融行业只要专注营造分行气氛,维持窗明几净自然就有顾客上门,现在使用者则透过任何可能的管道,例如智慧型手机或平板电脑与银行接触。」他提到,正是因为如此,仅仅只收集交易型数据已经不足,企业还要关注使用者在网站、App上的使用行为,「互联网的多样性,隐含的是从分析交易,转向分析客户的行为、观感,从而找出市场。」

    只分析有价值的数据

    在数据经济年代,数据就是黄金。即使是看似不起眼的对话、分享或按赞,都可能是新契机的来源。於是每一笔数据都不应该被遗漏,也都应该汇入分析平台参与分析。郭柏森提醒,实务上,真正有价值的数据仅仅只是其中的一小部份而已,将复杂又大量的互联网一股脑儿地倒进分析平台,其结果可能会令人失望。一方面,互联网分析平台需要一个兼具效能与可靠度的储存环境,但是要将这么庞大的数据都存放在高阶的储存环境中,造价相当高昂。例如国内某电子商务(EC)龙头业者每天至少产生1GB的数据量,换算下来,365天就要365GB,硬碟容量是一个很大的挑战。而另一方面,企业将会发现里面所隐含有价值的数据量可能只有几MB。

    郭柏森认为,在还不清楚数据的价值之前,企业应该先选择一个相对便宜的存放空间。一旦经过数据探索等手法,把数据价值找出来之后,再把数据引入分析平台内。「一个统一的平台已经没有办法满足企业,企业该思考的是分析平台是否能够很容易地与各个平台进行数据交换。」他举例,企业不妨把最重要的数据放在数据仓储,如果有其他数据的需求,可以从Hadoop、甲骨文、MongoDB中把需要的数据抓过来合并分析,这就是Teradata Data Grid概念,只把确定有价值的数据放进企业数据仓储平台,就能让企业避免高昂投资成本,同时保有良好的分析成效。

    从错误中累积判断力

    高昂的投资成本是现阶段企业导入巨量分析平台过程中一道相当大的门槛,而另一方面,如何在茫茫的数据海中,确定该笔数据确有价值,也是一项很大的挑战。当企业在面对互联网议题时,分析人员将会是其中非常关键的一环。

    郭柏森提到,对分析人员来说,互联网是一个陌生的领域,「我们会建议分析人员用尝试错误的方式来找出数据价值。一旦分析人员有了新发现,立即就要丢进市场测试水温,如此才有办法确定新发现有没有价值。愈快发现错误就代表愈快成功,不断地从错误中淬链,才能找出数据黄金。」

    当然,企业也必须提供给分析人员更多培训与尝试错误的机会。「并不是要导入互联网分析就要舍弃旧有技术。对企业来说,交易型的数据分析还是有存在的必要,因此,不妨以此为基础,再让分析人员的技能向外延伸。」他举例说明,例如把分析人员分组,有一组人可以将交易型的数据与客户使用行为的数据透过新技术,合在一起分析,而另一组人也可玩玩Open Data,从人口、天气到不动产实价登录的资讯都可以把它纳入,看看能不能与企业收集到的客户资讯,激荡出火花。

    料理包还是厨师

    互联网分析讨论日益热络,市场上提出的解决方案也琳琅满目。该如何从中找出适合企业应用的解决方案?郭柏森认为,这得看企业有多少决心,在技术的层次上并没有好坏与对错,但是企业是希望在短时间内就有一套解决方案可以支应,还是希望真正在企业内部打造出数据分析团队,就有很大的差别。

    「一位前辈曾这么说,如果你去市场上买一个已经包装好的解决方案,就像买到一个料理包,每天微波,吃的是同样的口味与食材。但是当你一开始先打造一个简单的厨房、培养几个初级的厨师。慢慢地,他们的菜会煮得愈来愈好吃。」他再次强调,目前市场上确实有很多速成包,但企业该培养的却是这些数据分析人员。

    当然,如果完全对技术不了解,目前有几款解决方案都提供了免费的版本,企业若想尝试或测试这样的技术,不妨从免费的版本开始。等到真正对企业有帮助时,再来慎密规划,唯有对产品有更进一步的了解,未来需要规划时才不会走错方向。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款