你好,游客 登录 注册 搜索
背景:
阅读新闻

大数据让世界色彩斑斓

[日期:2013-12-27] 来源:网易新闻  作者: [字体: ]

  维克托·迈尔—舍恩伯格:奥地利人,被誉为“大数据时代的预言家”,现任牛津大学网络学院互联网研究所治理与监管专业教授 照片为本人提供

  2013年,“大数据”这一概念以夺目之势走进了我们的视野,学者在介绍,政府官员在谈论,世界互联网企业则纷纷启动“大数据”竞争,有媒体将今年称为“大数据元年”。大数据,正由技术热词变成一股社会浪潮乃至国家战略。

  去年以来,两本关于大数据的着作先后在中国出版,一本是奥地利学者维克托·迈尔-舍恩伯格所着的《大数据时代—生活、工作与思维的大变革》,一本是旅美华人学者涂子沛的《大数据:正在到来的数据革命》。近日,本报记者对两位学者进行了专访。

  大数据带来思维变革

  求知:作为大数据时代的预言者之一,你是怎么发现数据的价值的?

  舍恩伯格:数据的价值是在以创新为目的,重复使用数据的过程中被发现的。这里的价值,不再像过去那样把数据当作采集的对象,而是从许多可能的用途上进行挖掘。例如,交通数据最早被收集起来,是为了给拥堵区域设计相对合理的出行线路,但后来人们开始以构建公共交通规划、优化交通布局为目的重复使用这些数据。所以我们可以长期围绕同样的数据展开想象,发掘它值得被再利用的“额外”价值。不过,这种价值的发掘者必须具备大数据思维,即理解和鉴识数据重要性和影响力的能力。

  求知:你的经历背景有点复杂。曾做过程序员,并开过与之相关的公司,但你接受的是法学教育,尽管你表示自己并不喜欢法律。这种跨领域的经历对你研究数据有帮助吗?

  舍恩伯格:我还在伦敦政治经济学院学习过。我喜欢学习—学习是以不同视角看世界的钥匙,它让我眼界大开。也因为这样,我渴望接受新的想法和新的观念。在学校的时候,我还参加了物理奥林匹克,所以我也很喜欢自然科学。

  我不喜欢法律,但它非常有用。它教会一个人严谨的辩论,逻辑性更强—这非常受用。而且法律通常反映现实,因此一个人如果很好地理解了法律,就能通过这本打开的“书”了解社会。另外,我的法律教育背景还让我形成了一种信念,即法律可以是一种有效塑造社会的机制,它可以改造社会,防止社会陷入发展困境。

  求知:简要描述一下大数据给生活、工作、思维带来的变革。

  舍恩伯格:伴随着大数据—大量更多的数据点和分析它们的新方式—我们会获得一种新的关于世界如何运行的洞见。这种洞见是小数据时代无法给予的。它提示和改进着我们的决策和预测能力,让世界朝着更好的方向前行。

  不可能让一切数据化

  求知:大数据时代,数据与越来越多的事物联系在了一起,如何建立数据与具体对象的联系?可以用数据概括和对应一切吗?如果不可以,哪些事物是数据无法囊括的?

  舍恩伯格:数据将涵盖越来越多的我们想要研究的特定现象,或为我们困惑的问题作出回答。很明显,数据不能囊括一切—它永远是现实的影子,永远不完整—我们必须了解这一点。正因于此,今天我们拥有了更多可以利用的数据,赋予我们此前不具备的、观察社会动向与发展的能力。

  无论是掌握多少人在什么时间选乘哪条公共交通线路、学校里哪种教材更受欢迎、便于学生吸收之类的信息,还是了解怎样更快地诊断疾病,为特定个体选择最优的治疗方案,这些数据应用的例子都以大数据为基础。它们有着改良社会的力量,尽管它们无法涵盖一切,不可能让一切数据化。

  求知:强调相关关系而不是因果关系,但你不认为预测其实是另一种形式的原因吗?我们可以依赖预测吗?

  舍恩伯格:是的,如果我们搞清楚了它们的固有几率,我们是可以依赖预测的。虽然它们无法告诉我们一个确切的未来的样子,维系一切的只是可能性。这种预测以相关关系为基础,同时我们要注意不要跌入虚假关联或偏见的陷阱。相关关系对现实的洞见力不比因果关系差,但因果关系往往非常难确认。

  求知:有调查指出,未来从事文职工作的人将面临职业的消亡并随之失业,而那些懂得技术的人则会很快找到工作。未来会不会由科学,甚至说数学统治这个世界?你是怎么看这样一个世界?

  舍恩伯格:我没有做过相关研究,因此也无法给出具体的评价,但从原则上来说,我怀疑任何将世界涂成一种颜色的论述。

  防止数据巨头的出现

  求知:大数据如何改变商业世界?

  舍恩伯格:现在商业可以更有效地、以更低的成本做他们想做的事。这意味着消费者也可以享受到更低的价格。不过更重要的是,大数据时代的商业有能力创造新的产品和服务,而这些是小数据时代不可能提供的。例如,汽车可以在它真正坏掉之前,提示其哪个部分可能有问题,因而减少了汽车突然发生故障停在路边的可能性。这项新的服务就在五年前还是完全不可能的事,但现在它却成真了—多亏有了大数据。

  求知:既然数据很重要,是不是说掌握数据的人掌握了一切?处理数据的方式重要吗?

  舍恩伯格:掌控数据的人拥有很大的权力,因此我们必须加以警惕,防止权力过大的信息巨头的出现。但是通常来说,那些海量数据的拥有者并不知道怎么开发这些掩藏于数据中的价值。所以他们可能要让其他擅于挖掘数据价值的人来使用这些数据,实现其中的价值。因此,情况远比人们最初所想的复杂。掌握所有的数据也不能保证成功。

  求知:未来会不会出现这样一种情况,数据拥有者将得到更多的资源和财富,相反,没有数据资源的人则会陷入贫瘠,人与人之间、企业与企业之间、国家与国家之间的差距会因此拉大,就像越来越悬殊的贫富差距那样?

  舍恩伯格:像我前面所说的,尽管我承认新的“数据鸿沟”的危险,但情况是复杂的。不是所有数据拥有者都能了解其中的价值,有时那些没有掌握数据的人有着非常好的,关于怎么处理、应用数据的想法,他们也因此能获取到别人所拥有的数据。在这个意义上,大数据对于目前没有数据权的人来说也是一个很好的机会。

  再者,大数据经济下,许多刚起步的公司不需要大额资金投入就能取得成功。过去公司要有工厂、印刷厂、成千上万的员工。而在大数据时代,可能有一个好的点子、找到一个实现它的方法就足够了,租用云计算服务可以让成本降到很低。因此,大数据也让小的竞争者更容易成功。

  保护数据权利就是保护人权

  求知:公司掌握了更多的数据,这意味着它们既可以将其用在好的地方,也可以将其用在坏的地方,你怎么看这种潜在的危险,我们该如何避免?

  舍恩伯格:我不确定相对政府来说,公司是不是掌握了更多的数据。最为明显的,如美国国家安全局收集到的庞大的数据。但是现在的公司掌控着许多的数据确实是一个事实,同时这些数据在很大程度上与个人相关,我们需要确保数据隐私法律严格、到位,以防止消费者和个人的隐私权受到商业滥用的侵害。

  求知:说到政府,他们确实也掌握着大量的数据,就像我们在斯诺登案中看到的,对此你有什么看法?

  舍恩伯格:我认为美国国家安全局掌握了过多的数据。与商业组织对数据的控制不同,政府可以把我关进监狱,而谷歌不能,这也是我更关心政府对数据的控制的原因。

  美国应该接受建议,重新考虑国家安全局的一些惯例性规定。一个好消息就是最近由杰出专家组成的团队已经起草了一份交给美国总统的报告,报告提出了48条合理建议,用以抑制国家安全局对数据的无限获取。我希望这些建议中的一部分能够得到采纳。

  求知:互联网隐私权会面临怎样的处境?

  舍恩伯格:和现实生活中一样,我们有赖于网络上的其他人尊重我们的隐私权。不过,相较于同类情况,在互联网上记录和交流信息很容易,甚至不需要他人注意到或了解到这些信息。它的好处就是出于数据的经济性或私人性,数据本身或许可以以较低的储存成本转化为价值。这意味着更多来自和关于我们自身的信息会记录和储存在互联网上。也因此我们在互联网中“剩下”的隐私会不断减少,只会有很少的隐私空间。

  求知:我们注意到“信息自决权”这个概念,就是个人自己决定在网络上发布个人信息。那么,网络隐私和“信息自决权”是什么关系?所谓的“信息自决权”会不会是逃避履行隐私监管责任的一种方式?

  舍恩伯格:信息自决权是人权的一种。它指的是一个人具有决定是否在某个时候、以什么目的,收集、分析、储存,以及与第三方分享与其本人相关信息的权力。它也是欧洲数据保护法的核心。

  数据可能进入世界贸易

  求知:在大数据时代,怎么看待互联网治理?

  舍恩伯格:互联网治理的核心意义在于谁在指挥互联网世界中虚拟道路的方向。当我们决定由谁来指引信息流的方向时,是选择一家由美国商务部控制的美国公司,还是联合国下属专门机构的国际电联这样的组织?应该是某一个国家、个人,还是某一群工程师?这个选择非常重要,我们必须就该问题作出决定,但又不能妨碍互联网的功能。

  我们需要平衡变革的必要性和风险。在互联网治理这个问题上,一方面采取国际化的态度,另一方面需要坚持已经成共识的互联网基本原则:多元化。互联网是全球性的,我们需要互联网治理的全球化。

  求知:既然互联网是全球性的,那么如何确保法律在互联网上有效实施?

  舍恩伯格:互联网的全球性本质不会从根本上阻碍国内法的实施。电话网也是全球性的,我们却从没有就如何建立专门的法律框架展开细节讨论,使其有效施行于全球电话网。互联网的全球维度问题仅仅在信息跨国传递,并且信息输出国和接受国所适用的法律有较大差异的情况下出现。因此我不确定我们是否需要考虑这一层面的问题。当然,一旦涉及侵犯到公民线上基本权利的案件,有力的国家干预是必要的。

  求知:数据分享是否与保护知识产权相矛盾?换句话说,互联网会不会让保护知识产权成为不可能。

  舍恩伯格:不会,两者没有太大的关系。数据本身不被知识产权法保护。版权所保护的客体仅限于艺术作品。

  求知:如果世界由拥有更多数据的人统治,那么未来国家之间是否存在数据壁垒,就像现在国际贸易中的贸易壁垒?

  舍恩伯格:如果数据成为一种新的“黄金”,那么确实有必要将数据流通引入到贸易谈判之中。未来自由贸易不仅包括铜、香蕉这类能源或物产,也包括数据的流通。

  数据泡沫掩盖不了变革趋势

  求知:数据会对民主产生影响吗?

  舍恩伯格:是的,这种影响已经有所显现。当我们讨论重要的公共议题时,人们首先会拿出数据,然后以数据为基础展开辩论,最后的结果也有赖于数据分析。这是一件好的事情,因为这意味着我们的决策越来越理性和全面。这个趋势只会继续。数据将推进我们的辩论。

  求知:有人说数据创新存在泡沫,你同意吗?

  舍恩伯格:当然,因为大数据承诺了诸多重要的改变,许多人试图描绘一个他们无法提供的,具有大数据意义的服务。不管什么时候都会有淘金热的情况,会有许多人围绕着“金矿”,寄希望以不公平的方式,或者通过贩卖没有价值的商品,从中谋取利益。所以毫无疑问会有数据泡沫。但是泡沫之外,大数据时代所带来的有力变革也是切实的。所以我们必须超越泡沫、过热等问题,看到大数据带来的真实的、深层的、基础性的变化。

  求知:怎么看中国的大数据?你从中国看到了哪些数据上的创新?

  舍恩伯格:我坚信中国将在利用大数据优势的时代占据重要一席:这因为它的规模(相对于别的地方拥有更多可以收集和分析的数据),以及很强的数学能力、对科学的兴趣。就我“中国行”的感受来看,这里的人非常愿意“倾听数据”,这很好。

  采访手记>>>

  维克托·迈尔-舍恩伯格非常忙。作为大数据领域最受人尊敬的权威之一,他的每一分钟都被安排得满满当当,一面任教于牛津大学网络学院,着书立说;一面受到世界各地邀请,接受采访、发表演讲,传播大数据理念。

  记者最初通过电子邮件发出采访要求的时候,完全抱着试一试的心情。没想到,舍恩伯格很快回复道,很乐意接受采访,并“敦促”记者快把提纲发来。

  大数据问题涉及面实在太广,记者一口气写了二十个问题发给“老舍”,怕对方嫌问题太多,不好意思地表示,他可以选自己感兴趣的回答,如果全部回答了当然更好。最初的几天,舍恩伯格迟迟没有回复,关于他是不是太忙,会不会正在赶往某地的飞机上,没有收到邮件的担心随之而来,于是又给他发了封强调截稿时间的邮件。

  他次日回信称,收到了邮件,正在过周末,礼拜一给答复。于是,记者果真在礼拜一晚间,也就是圣诞平安夜的前一天,收到了一封来自英国的采访回复,题头写道:“如我所承诺的,以下是我的回答……”并且,他对每一个问题都作出了回答。

  虽然昨天就是圣诞节,但还是想在这里用舍恩伯格不熟悉的语言,再次对这样一个愿意抽出假期传播思想的学者,一个注重承诺的奥地利人表示感谢,祝他圣诞快乐。

  观点提要

  什么是大数据

  大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。传统采样的目的是用最少的数据得到最多的信息,当我们可以获得海量数据的时候,它就没有什么意义了,此时,样本=总体。

  什么是相关关系

  建立在相关关系分析法基础上的预测是大数据的核心。在小数据时代,相关关系分析和因果分析都不容易,都耗费巨大,都要从建立假设开始。建立于假设的分析有受到偏见影响的可能,也极易导致错误。大数据和技术能力的提升,为更准确、更快的相关关系分析法创造了条件,最生动的例子,就是你在亚马逊网站购书之后,网站此后会不断地向你精准推送你可能感兴趣的书。通过探求相关关系里的“是什么”,而不是因果关系里的“为什么”,相关关系帮助我们更好地了解了这个世界。

  什么是数据化

  计量和记录一起促成了数据的诞生,它们是数据化最早的根基。将世界看作信息,看作可以理解的数据的海洋,这些海量的计量和记录,无论是文字、地理定位信息,还是态度、情绪,都可以被分析,为我们提供一个从未有过的审视现实的视角。





收藏 推荐 打印 | 录入:elainebo | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款