你好,游客 登录 注册 搜索
背景:
阅读新闻

从大数据到大分析,口碑比过去更有力

[日期:2015-04-27] 来源:中国大数据  作者:麦克弗兰克 [字体: ]

大数据

    口碑就是力量。

    你的口碑会决定你交谈的对象,以及他们会和你一起做或为你做的事。口碑也会影响银行是否会借钱给你买房子或车子、影响房东是否愿意租你房子,也会决定哪些雇主愿意录用你或者你是不是能找到工作。口碑也可能决定你得到的特别优惠与贵宾体验的种类,而且也可能大大地影响到你潜在的约会对象。另外,你在保险业者之间的口碑,会决定你得到的保险范围是否能涵盖健康、汽车、房子或寿险。而你在政府机关的口碑甚至会影响你,是否会因为某个犯罪行为而被调查。

    现在,口碑的力量比过去任何时期都更加强大。这一切都要感谢数据科技的快速发展,你的口碑将会无所不在、永久保留,而且,不管你喜不喜欢,在全球各地都可以取得。无论你到哪里,不论你是否知情或同意,其他人都能立刻取得关於你个人口碑的资讯。

    在所谓的大数据」(Big Data),也就是收集与保存大量资讯的趋势之後,口碑的影响力就顺势发展得极为顺利。但是,新颖的口碑经济则仰赖我们称为「大分析」(Big Analysis)的力量,这是一种新的系统,可以从收集到的巨量数据中,萃取有关个人的大量预测性资讯,然後把它转化为行动:否决你的贷款申请、找你面谈一份甚至还没公告的工作、或甚至把已经站在门口的潜在约会对象直接打发掉。以上这些可能发生的事,都是因为你的口碑,正以各式各样令人头昏且精密的方式重新数据化且互相串连。

    当然,口碑一直都很重要,只要问一下任何一个住过小镇的人,口碑可以维持多久,以及口碑如何影响他们的社交互动就好,特别是如果他们曾经犯了一个重大错误的话。但是在口碑经济时代以前,口碑只能在同侪互动之後慢慢形成,很少人对於非名人的大多数市井小民也能够无所不知,而且,口碑的维持也只能和人类的记忆一样久而已。

    现在,从收集、保存、分析并分配各式各样有关你的个人资讯,包括人口统计数据、驾驶纪录到你上网活动的完整纪录,数据科技都办得到。二○一○年代的商业行话,所谓的「数据采集」(data mining)趋势,让人针对几乎每一个能想像得到的主题,都能收集到海量的数据。这种技术会存在,是因为科技已经让收集与保存数据的费用,几近於零成本。一个理解现在的数据数据保存容量最简单的方法就是,1TB容量的硬碟,可以保存的资讯,比起放在普通研究图书馆里的数据还要多。现在,消费者已经可以买到这种硬碟,还可以俐落地放在大一点的裤子口袋里或小皮包里,花费还算便宜,不到一百美元,而且这个价格每年都在调降。结果就是,在今天,任何公司或个人都不需要大公司(或美国国家安全局)的资源,就可以保存有关其他人几乎无限制的个人数据。关於保存数据的方式,可以追溯到数千年前,从在泥板上辛苦地复写、到模具压制印刷、到今天用的磁性媒介,到很快的未来即将用到的具体装置。现在,由於保存数据的价格崩跌,几乎无限量的数据都可以用以前不可能的方式保存与处理。

    现在,数据资讯的保存实际上可以说是免费的,任何东西都可以被永久地收集与保存起来,而且很快就会演变成保存大量的数据组会比找出哪些数据要删除,要更便宜。接着,一旦数据可以被取得,就一定会有人想出用途。所以,有关每一个人海量的数据数据,包括所有你到访的网站和你点击的任何连结,都会被整理出来。现在甚至有一个快速成长、有关数据库与数据保存网站的地下经济,正在悄悄地收集数以兆计的线上活动资讯,只是在等着想出使用这些数据的方法。

    虽然「大数据」想起来很恐怖,但如果不知道如何使用,这些进进出出的数据其实一文不值,只是一系列的「1」与「0」罢了。大数据真正的力量(不管是为了良善或邪恶的目的)是在下一个步骤,藉由新的电脑系统与演算法,在数以百万笔的数据中进行分类与筛选,最後找出可以据以行动的理解力。因此,未来不是被掌控在收集最多数据的公司或个人身上,而是能够找出这些海量数据组最大意义的人,这就是「大分析」。如果大数据可以被理解为你正坐在金矿上,大分析事实上就是把金子从地下挖出来,而且已经把它变成金条了。

    从大数据到大分析的变化是巨大的,这不只是保存数据的容量变大,也包括解读、分类与分析数据的能力大幅提升了。如果摩尔定律──电脑的运算能力每两年增加一倍──和过去数十年一样继续有效,那麽未来数据分析的力量也会继续成长。结果很可能是,人们会开始委托电脑做更多决定,包括过去由人类做的数百万种决定。

    想知道这会对你造成什麽影响,不妨想想看,企业现在如何发展出各式各样的系统,以便在每一分钟内就做出数百万个有关消费者(像你这样的人)的决定。而且这类决策范围也在快速扩展中,从合理而不令人意外的决定,例如试着辨识不正常的交易以降低信用卡诈骗事件,到会让你觉得震惊的事,范围可能从保险业者会根据线上活动而拒绝承保、公司会根据电脑驱动的分析自动决定人员的晋用与升迁、到行动电话让人在酒吧可以即时查核某人的背景等等。根据你买了这本书这件事,又会被做成什麽样的决定呢?希望是好的决定,但我们会在下一章做更进一步的探讨。

    很快地,根据你每一件事的口碑,从是否工作勤奋、具有财务责任到健康状况,企业会利用这些大量的数据组来评分你的口碑,类似FICO信用分数(credit score) 的意思。就像搜寻引擎让使用者可以在全球资讯网上搜寻资讯,「口碑引擎」(reputation engine)也会让企业,并慢慢地让每个人,去搜寻你的数据足迹,以找到有关你上线与离线时的活动和人际互动资讯。但是,请把信用分数想像成即将到来的口碑经济一种非常原始的版本;如果把信用分数比为传统的市内电话听筒,那麽未来的口碑分数就会像最新款的iPhone。不管你想不想参与其中,这都会发生,而这些分数就会被别人用来做出与你有关的重大决定,比如说要不要录用你、要不要让你加保、甚至要不要和你约会等等。

    而且,这些决定做得比以前任何时间更快。你以前听过一眨眼之间做的决策吧,现在,电脑以快数千倍的时间,做出了大部分的决定。人类的一眨眼可能是四百毫秒(按:一秒的百万分之一)的时间,在这段时间,一台普通的笔记型电脑几乎就能运算十亿次。这种持续增加的速度所带来的冲击是惊人的,事实上,由令人头昏的复杂演算法驱动的口碑引擎,现在已经可以在每一秒钟收集超过数百万笔的纪录,以便辨识出优良或恶劣的信用风险、以及可能在考虑辞职的员工,还有其他更多可能。举个简单的例子,你现在比以前更常在工作时浏览领英(LinkedIn,最大的专业人才社交网站)吗?很多演算法把这当成员工正在找新工作的危险信号。如果这资讯是由招募单位取得,他们可能会打电话给你,引诱你接受新的工作机会。如果是被你公司得知这项资讯,他们或许会找你谈谈怎样才能留住你,或者把你快速踢出公司大门。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (1)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款