你好,游客 登录 注册 搜索
背景:
阅读新闻

大数据时代的新闻

[日期:2014-03-22] 来源:经济观察报   作者: [字体: ]

  斯坦福大学的多媒体和信息设计专家乔夫·麦吉曾经是《纽约时报》的记者,后来专注于数据新闻领域的研究。在谈到数据新闻业的时候,麦吉认为,数据新闻相对于传统新闻业来说更能让人主动、精确地去还原故事的现场。他说:“在普通的媒体要找一个故事,就需要派记者出去打听线索。将来很可能有一组很大的数据挖掘,就从这个里面去找故事。《纽约时报》过去就是很善于记录数据的,比如船只到达的时间、货物量等等。一百多年以后,在你笔下的故事、角色,很可能就是当初被记录的数据。包括《华尔街日报(博客,微博)》,也是把股票数据记下来,通过这些数据就能转化出当时的人物——投资家,总统,州长,等等。数据新闻要做的事情,就是把数据还原成故事和人物。这个还原过程,就是数据可视化的过程。”

  在这样的数据可视化过程中,央视就发现了电视新闻的新的方向。马年春运和春节期间,它联合百度推出“据说春运”、“据说春节”,调用百度的大数据(包括迁徙数据和搜索数据),将其融入新闻内容的策划与创作过程中。作为中国影响最大、受众最广的媒体,央视迈步探索数据新闻,无疑会给其他媒体带来示范效应。

  可以展开合理的想象,来对比传统新闻报道和数据新闻的区别。以2014年2月央视曝光东莞色情业为例,如果央视的记者走传统路数的话,就会是一个出镜女记者站在东莞高速路口做模板式的报道:“我台记者现在XXX做现场报道。昨夜,东莞市政府出动大量警力清查了多处涉黄场所。今天,我们看到在高速路口,出城的车辆明显多于进城的车辆。”然后,女记者举着话筒跑到一个在收费口排队的私家车旁边问,“先生,您什么时候来东莞的,现在要去哪儿?”

  但在网络上,当央视的新闻播出后,一部分网民想到通过“百度迁徙”查询东莞当天的人口迁徙状态,结果显示,从东莞去往香港的人占比最多,于是有人将其视为香港人逃离东莞的佐证。虽然事后有媒体质疑这种解读并不完全靠谱,东莞的人口流动与色情业的关联度并没有那么高,但这并不影响网友在微博、微信上转发和评论的积极性。

  当数据被解读成一个又一个故事,这个还原过程是非常有趣的。更重要的是,还原的过程本身也构成新闻的一部分。

  公众解读的激情

  “百度迁徙”是基于数亿部智能手机的LBS定位服务数据实现的,根据用户地理位置的变化,判断出用户发生的“迁徙行为”,并最终进行直观、动态的可视化展现。究其本质,这是一种数据流。

  麦吉认为,数据新闻就是在放大新闻的信息属性,而这个属性的展现形式是数据流。以往,记者使用的摄像机、话筒、笔,都是信息采集和记录工具,但是将这些信息传递出去的过程,是一个封闭的过程。传统新闻制作流程是不允许公众干预或者说参与进来的。也就是说,数据编码和解码的过程,与阅读者无关。

  数据新闻的着力点恰恰在此。移动互联终端取代了传统摄像机之类的信息采集终端,每一个人成为数据化单位,个性化的数据记录则由App来完成。个体无意之间变成了新闻的参与者。(注意,这里说的是“无意间”。如果是“有意”的,更会对传统新闻业造成天翻地覆的变革。)

  当百度用可视化工具将东莞的人口流量呈现出来时,公众获得的第一个权利就是解读的权利。从微博和各种自媒体账号的讨论来看,公众的解读热情显然被一下子释放了出来。这种数据新闻对于当下中国来说,也许我们还不能将其上升到颠覆了什么、改变了什么的高度,但可以说带来了一种崭新的气象——“新闻谈资化”。

  所谓新闻谈资,就是充分利用了公众的好奇心,捕捉事实之外的留白。比如“大象公会”微信公号做过的为什么主席头会流行、为什么朝鲜阅兵礼最震撼等等。而数据新闻背后的谈资会更多,比如围绕着为何“逃离”东莞的主路线会是香港,还有哪几条清晰可见的线段,就能衍生出大量相关话题。而话题,无疑就是谈资。

  下转 42版

  上接 41版

  数据新闻的灵魂:开放

  2013年,一则人事变动的小小新闻并没有引起互联网界很大的反响,但是对于数据新闻业来说,它关乎这个行业的两个巨头。也许,我们在若干年回过头来看这则新闻的时候,会感觉到有权杖交接味道。

  2013年4月18日,为《卫报》效力15年之久的老牌记者西蒙·罗杰斯在其个人博客上宣布,他跳槽前往Twitter效命。斯人之所以关键,是因为他是《卫报》“Dat-ablog”的发起人,可以说《卫报》在数据新闻领域能在全球走得如此超前,和罗杰斯的努力分不开。

  2009年,罗杰斯在总编阿兰·拉斯布里杰的鼓励下开设了Guardian Datablog。它以博客的形式出现,提供新闻故事背后的完整数据,包括原始数据、统计和可视化数据。现在,Datablog拥有一个网 页 Data Store(guardian.co.uk/data); 可搜索的世界政府和世界发展数据库;一个包罗万象的由A到Z的话题数据库;由《卫报》美编制作和从网上搜集来的大量可视化数据;还有有关公共开支数据的调研工具。每天,《卫报》的数据编辑利用 Google spreadsheets分享报纸工作背后的完整数据,并将这些数据予以详尽分析和加以可视化,最后为报纸的印刷版和电子版提供新闻。《卫报》在很早就意识到了新闻需要新的形态,也就是“开放新闻”。拉斯布里杰对“开放新闻”的定义是:它是一种完全织入世界上现存的信息网的新闻。它和这个网络相连;从网络中筛选和过滤;与网络紧密合作;利用普通人发表和分享材料的能力更好地讲述世界。为了让人理解,拉斯布里杰用一连串排比诠释了什么叫做“开放新闻”。“旅游版在寻找对柏林了如指掌的一千人。环境团队试图扩大环境报道的范围、权威性和深度。国际报道组想要收获尽可能多的来自阿拉伯的声音,以帮助报道和解释那场春天的革命。体育编辑在想怎样才能更好地报道竞逐世界杯的32个国家球队。评论编辑希望拓宽辩论的光谱,从政治思想家到科学家到神学家到律师……这家报纸正在超越一家报纸的界限。记者发现自己能够呈现更完整的画面。”新闻应该来源于大众,同样也应该属于大众。拉斯布里杰认为新闻的未来影响取决于它有多开放和多透明。《卫报》没有像《华尔街日报》和《纽约时报》一样,把自身的内容锁在付费墙之后,而是公开了众多的数据集、文章、视频和图像——包括自1999年以来的超过一百万个故事——并邀请世界重新混合。这不仅仅是利他主义。《卫报》认为分享内容能够帮助开启新的服务和收入来源。正如 YouTube 视频已经变成整个网络上各种网站普遍存在的一个特色,拉斯布里杰想让《卫报》的文章、图像和数据集在博客圈、社交网络和其他一些流行的目的地中也变成一个无所不在的特色。为什么《卫报》要认为只有它的内部团队才能够设想并有利地实施所有潜在的令人信服的办法,在今天和未来把它的内容打包并传递出去?如果几百个甚或几千个合作者有机会也有动力在《卫报》内容的基础上来革新,它成功的机会难道不是更大吗?

  在“开放新闻”理念的指导下,《卫报》成为世界上第一家将用户自生产内容和众包集成进其商业模式中的报纸,也是最早把自身转化为数据共享的真正开放性平台的报纸之一。作为《卫报》数据新闻的排头兵,罗杰斯敏锐地认识到,随着网络“泵出”越来越多的数据,读者将会对新闻背后的原始数据产生异乎从前的兴趣。在《卫报》推出Datablog之前,创办者以为目标用户会主要是那些围绕数据开放平台建立应用的软件开发者。实际上,普通读者对数据的需求更热烈:从碳排放到东欧的移民数量,从阿富汗死难者的分类到披头士在他们的歌中所唱到的“爱”的次数,读者对各种各样的数据都趋之若鹜。

  前文中曾提到“无意”和“有意”的话题。百度迁徙地图,是让公众无意成为了新闻的参与者。而真正的数据新闻,则应该是以开源的理念制作,让公众有意参与。就好像罗杰斯在接受采访时谈到,众包是他们制作数据新闻的主要手段。比如,《卫报》做的对国会议员开销的调查,就是一个经典案例。

  2009年,英国爆出政客选举开支丑闻。《卫报》的竞争对手《每日电讯报》每天都在头版上揭露那些骇人听闻的有关选举获胜的官员根本站不住脚的花费。《每日电讯报》有一个专门的记者团队对泄露的文件检查了一个月。作为对公众愤怒的回应,政府宣布将在线公开超过100万份扫描的文件和收据,而这是足以淹没任何新闻机构的数据海啸。

  《卫报》每天都为仍然落后于《每日电讯报》的抢先报道而懊恼,它开始请求读者帮助筛选这100万份文件,并找出至今仍未被披露的渎职行为。报纸的网站上开始运行一个开源软件,允许读者一个个检查记录并把收据用四种方式归类:“感兴趣的”、“不感兴趣的”、“感兴趣但是已经知道的”、“调查这个”。超过两万名读者做出了贡献。17万份记录在80个小时内就被检查完毕。《卫报》在头版设置了一个进度指示器,让研究者分享一个共同的目标。随后,它又开发出一个业绩最佳志愿者的名录,这进一步为志愿者增添了动力。当《卫报》为每一个收据都配发了一幅下议院议员的照片时,读者的反应骤升。报社甚至从亚马逊公司租赁了便宜的服务器空间来处理最初的雪崩式的的关注。报纸最后的现款支付:少于150美元。这促成了一种众包式的调查性报道,而关键的是,这种创新帮助报纸与它的读者建立了一种更为融洽的关系。

  干预和参与的力量

  事实上,寻求开放是大数据时代的根本动力。大数据更像是一场行进很久的运动的高潮。这场运动发轫于上世纪80年代,以理查德·斯托尔曼、林纳斯·托瓦兹和埃里克·雷蒙德为代表的开源三杰认为知识应该以共同创造和共同享有的姿态出现,而不是被垄断在寡头手中。随后,在著名出版商、Web 2.0之父蒂姆·奥莱理的倡导下,开源运动进入了第二个阶段,即数据开放。

  也许今天,我们认为开源是大势所趋,但在互联网还没有出现、甚至是刚刚步入青春期的时候,封闭与开放两大流派曾进行过长时间的激辩。这甚至影响到了美国政府的信息开放政策。

  从布什政府以反恐为名,连续出台了两个争议颇多的法案——《爱国者法案》和《2002国土安全法》,到奥巴马提出“人民知道得越多,政府官员才可能更加负责任”;从布什政府时代政府和公众的交流受限,到奥巴马签署《透明和开放的政府》备忘录,美国一直在开放的路上走走停停。

  就在奥巴马实践其开放政府理念的同时,一位互联网的传奇人物在英国也实践着他的数据网梦想。他就是万维网的发明者蒂姆·伯纳斯-李。在他的力推之下,英国政府开始了数据开放运动。英国的data.gov.uk上线后,公众可以在该网站上查到3000多项民生数据。保守党领袖卡梅伦担任英国首相之后,更是提出了“数据权”的概念,即获取数据是每一个英国公民的基本权利。

  从IT领域的开源到政府的转型,这是一场长达30多年的以“开放”为灵魂的历史运动,而移动互联网的兴起无疑把这场运动推到了前所未有的高峰,这个高峰被命名为“大数据时代”。

  新闻同大多数行业一样,无法摆脱时代思潮对它的影响。在大数据时代的背景下,新闻不仅应该注重对数据的整理和解读,更应该懂得数据源于公众,属于公众。

  海地的数据地图被公认为是世界上最完美的数据地图。因为在海地地震期间,大量的公众参与了数据地图的建设,一直到现在还有人在继续完善。作为数据新闻从业者的行动指南,《数据新闻手册》也使用众包的方式完成的。

  由于Twitter等新媒体工具的兴起,我们开始变得不再关注新闻本身是什么,而是更加沉浸在作为个体参与其中的乐趣之中。正如罗杰斯所说,“报纸传统的与读者的单向关系正在被人手一部移动设备、随时产生新闻的新形式所取代。……只要我们做新闻工作,Twitter便是一个重要的元素。它在每个涉及政治、体育与娱乐的重大事件中都不可忽视,而且越来越重要”。罗杰斯告别《卫报》的博文值得每一位研究新闻业转型的人去拜读。《再见,卫报。你好,Twitter》,简单直白的题目,直接让我们看到了在这位资深编辑眼中,谁才是新闻的未来。

  与Twitter的数据所发挥的新闻效应一样,百度的大数据新闻意味着一种新闻理念的进步,但仅仅是一个开端。除了获取谈资之外,我们需要更多的干预或者参与的力量。在中国,数据新闻目前还只是作为为传统新闻模式服务的新工具,距全新的制作新闻理念仍有很大距离。对照《数据新闻手册》,它将数据新闻的重要意义总结为如下几点:

  1.过滤数据流;

  2.提供不同的新闻报道路径;

  3.类似带有数据的摄影新闻;

  4.构成获取信息的新方法;

  5.定位异样的东西,识别新兴的趋势;

  6.对官方信息作出独立诠释;

  7.消除信息不对称;

  8.提升新闻从业者的技能;

  9.对抗公关数据;

  10.节省时间;

  11.看到以前看不到的东西;

  12.带来新的生产和扩散知识的手段。

  最终,罗杰斯认为,数据新闻的使命在于,帮助人们发现和使用数据。数据以往是新闻机构的禁脔,它们普遍将其视为不可外泄的宝藏。现在,是新闻界改变心态的时候了。必须认识到,新闻从业者并不总是专家和内行。在任何一个给定话题上,总有人比记者和编辑更博学,因此可能对该话题做出极大的贡献。“所以,如果你把信息放出去,你会因此获得回报。”正是为此,拉斯布里杰有一段解释何为“开放新闻”的视频的题目就叫做“新闻记者并非世界上唯一的专家”。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款