你好,游客 登录 注册 搜索
背景:
阅读新闻

央视:“两会大数据”用信息化手段了解传递真实民意

[日期:2014-03-26] 来源:新华网  作者: [字体: ]

 

两会,数据,大数据

  2014年3月25日14:00,中国记协在二楼新闻发布厅举办“2014年两会宣传报道创新研讨会”。本次会议旨在贯彻落实党的十八大、十八届三中全会精神,交流两会新闻报道中的创新经验做法,展示全媒体在打通两个舆论场、提高舆论引导能力方面所做的新探索。三项学习教育专网(中国记协网)现场图文直播。

  [中央电视台经济部副主任 姜秋镝]2014年的两会期间,《两会大数据》栏目共播出九期节目,分别是《两会脉搏 全球跳动》、《搜寻两会最热话题:百姓心中的难和易》、《政府工作报告:谁在看?看什么?》、《百姓心愿单 政府施政单》、《中国报告 全球热搜》、《新词儿带来新期待》、《网民心中的人大常委会工作报告》、《两高报告:网民心中的三个"最"》、《大数据:搜寻网民两会热点轨迹》。在两会期间大量时政新闻占据版面的情况下,有六期的《两会大数据》在《新闻联播》播出,不仅如此,这个栏目从第一期播出开始,就在互联网和观众中掀起了收视和讨论热潮。而且关注度持续保持在高位。本文将从栏目策划、组织、实施等多方面,分析大数据和虚拟演播室如何和两会这样的重大政治活动结合,实现有效传播的路径。

  一、大数据的4V特点,传递你所不知道的信息。大数据抓取和分析技术是这些年才在中国兴起的,根据百度百科的介绍:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托・迈尔-舍恩伯格及肯尼斯・库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。在栏目策划之初,大数据的4V特点,给了我们创新报道内容的方向。

  但是目前在国内,真正称得上大数据公司的不是很多见,到底哪些大数据公司能够承担起两会新闻报道的数据挖掘分析,央视的这次合作究竟该选择什么样的大数据公司?这对我们来说也是考验。在项目启动前,我们对国内目前的大数据企业状况做了个了解。

  大数据有两个核心要素,一个是数据源,数据源决定了数据的广度,一个是数据挖掘技术和实力,技术决定了数据的深度,根据这两个特点,我们将大数据公司大致分为三类,一个是拥有全流量数据的大数据公司,通俗的说,就是和电信运营商合作,能够抓取来自运营商管道里有关网站、论坛、贴吧、微博以及移动通讯上的网民浏览、发表意见的上痕迹,这样的企业以中关村的亿赞普公司为代表,二是国内像百度、腾讯、新浪这些知名的大数据公司,三是垂直领域的大数据公司,比如像阿里巴巴,京东,他们更多的是商品交易数据。

  那么作为中国年度重大事件的两会报道,我们该选取和谁合作呢?阿里巴巴和京东这些公司,他们的海量数据都是有关商品交易的,对于经济报道来说,是富矿,但是对于一个政治活动的报道来说,这些富矿就有些用不上了。所以这次我们并没有和阿里巴巴、京东携手。而最终我们选择的是百度、亿赞普和腾讯微博三家进行合作。

  百度公司:在春节的时候,百度迁徙图对于春运回家的流入和流出实时的呈现,让不少观众大开眼界,此外丈母娘的礼物等热搜词,让观众看到了很多过去传统报道角度所报道不出来的新闻角度,那么这次对于两会,百度的长处就在于搜索信息的抓取,因为当网民对一个热点话题非常感兴趣的时候,为了深入了解,他们都会先去搜索相关内容,这对于我们做两会热点调查是个好办法,于是百度新闻热搜榜、百度热词榜成为我们合作的一种形式,而依托于百度自身拥有的百度指数,我们又能对相关的搜索词汇进行深度扩展,比如针对一个热词,网民搜寻其他相关词汇的需求图谱,短期趋势等等。我们对百度数据的提供定位为搜索网民的群像描述。

  腾讯微博:和新浪微博一样,腾讯微博的国内覆盖人群也在数亿人以上,微博的话题活跃度,能够给我们提供对网民话题的深度了解。亿赞普科技公司:这家企业不像百度、腾讯那么知名,但是作为中关村的一家大数据公司,他们连续两年承担国家863大数据课题,而且数据挖掘覆盖全球89个国家,在国内的覆盖人数也超过了4亿人,最让我们关注的是,它是一家全流量数据分析公司,构建不同的抓取和分析维度,可以让我们的两会新闻有深度,有细节。不难看出,这三家的选择,让我们的两会新闻报道既拥有了广度,又兼顾了深度,能初步实现大数据的4V特性。

  1、Volume巨量数据挖掘--体现真实民意。巨量、海量,通常是人民首先刻画大数据的关键词,但是大数据到底有多大?一组名为"互联网上一天"的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万。

  一天就会有如此惊人的数据量产生,那么两会期间产生的大量数据信息,就是我们首先要挖掘的富矿。为了能保证数据量足够大,我们都会根据一个话题,给三家大数据公司下同样的需求单,这样就保证了我们的数据抓取覆盖面广泛。比如,在做《政府工作报告:谁在看?看什么?》这个报道里,我们就围绕政府工作报告同时亮出了三张榜单,百度新闻的热搜榜、亿赞普的热度榜和腾讯微博的话题榜,然后从三张榜单中寻找重合的关键词,这样梳理出来的关键词,肯定是网民对政府工作报告最关注、最真实的热议话题。

  与此同时,我们还对这些巨量数据的背后进行深度挖掘和分析,一个个从来不为人知的新闻视角出现了。A、大数据眼中的"中国故事"。在《两会大数据》的第一集《两会脉搏 全球跳动》播出后,《解放日报》刊载了这样一篇文章,这篇文章写到:"中国召开两会,哪个国家最关注?这个问题过去可能无法解答,只能在类似 "全球高度关注中国两会"这样的文字报道中,通过记者的观察来给读者一个模糊描述。然而今年的央视《新闻联播》别出心裁,通过"两会大数据"这一栏目,给最关心中国两会的国家排出了名次。结果有点出人意料,印度尼西亚高居榜首,而美国列第四。精确读懂世界怎么看中国两会,有助于我们讲好中国故事。

  仔细分析一下这张排行榜上的国家,多数位于亚太地区,与中国有着密切的经贸关系和地缘交集。其中名列第七的秘鲁,大多数国人可能并不熟悉,但中国每年从秘鲁进口牛油果已成为当地人关注两会的理由。这也正是各国最关注的两会议题-中国经济如何发展。近日有研究指出,随着中国成为世界第一大贸易国,中国外贸对全球贸易贡献已占3成,对大部分国家和地区的贡献也已超过美国、日本。这一点我们不用谦虚,中国经济的确成了世界景气指数的重要风向标。另一方面,各国第二关注的领域就是中国的环保问题,毋庸讳言,主要关心的还是我们能不能治理好污染。所以大数据的分析结果其实并不意外,中国发展成败越是攸关谁的利益,谁就越会关心中国两会。过去对外介绍中国,花了不少力气,有些可能做到了点子上,有些就未必,但效果往往模糊且难以评估。如果我们把讲中国故事的方式,也改用大数据来说话呢?或许会产生更好的效果。

  之所以把这篇文章大段选用,就是我觉得这是众多肯定大数据挖掘新闻视角中,分析很到位的一篇文章。这集报道为何得到肯定那么多,就是巨量数据为我们呈现了一个不一样的视角,这集报道抓取的是全球89个国家的网民对中国两会浏览、关注、评价的数据,通过全球最关注中国两会的区域,到最关注中国两会的前十国家,让世界对中国两会的关注由过去的模糊变成精确,而且关注的内容和视角更加客观。而这一切,如果没有巨量数据的挖掘和分析,是根本无法实现的。

  B、大数据传递"百姓心中的难和易"。3月4日,当"两会大数据"第二集:《搜寻两会最热话题:百姓心中的难和易》报道播出后:总理办公室立即致电中宣部新闻局表示:大数据解读老百姓关心的热点问题节目做得好,李克强总理提出要表扬。一篇报道为何引来总理的表扬,是什么内容让总理关注?

  往年的两会报道,我们也会做民众关注。因为两会毕竟是个聚集民意的大会,无论是人大代表还是政协委员,他们都是带着民意来到北京的,那么民意究竟是什么?这些年,不少媒体在两会上做着努力和尝试,试图将民意传递给政府,比如热点问题调查,比如征集我有问题问总理,等等,虽然在一定程度上反应了民意,但是毕竟因为收集民意的手段有限,加上参与的人数有限,最终呈现的民意未必能真正反应民意。

  而这次我们运用大数据的挖掘和分析功能后,相对真实的民意呈现出来,而这些都是我们意想不到的。比如百姓心中的"难和易",如果靠我们的主观判断,百姓心中最难解决的会是什么呢?房价?教育不公?雾霾?还是交通拥堵?反正答案有很多,但是大数据为我们抓取分析的竟然是收入分配,不仅两年话题量稳居第一,而且关注度又上升了好几个百分点。最让大家没有想到的是,百姓认为这个问题最难解决,不是抱怨政府的改革不到位,而是认为涉及到体制改革,不是一朝一夕就能解决的,百姓的理性和对改革宽容,这是过去在报道中很难体现的。

  再比如百姓心中最容易解决的事情是什么?答案也会有很多,当交通出行这四个字出现时,大家又是一个意想不到,因为在北京,吐槽最多的莫过于交通拥堵,但是看大数据的分析,你会发现,北京的情绪未必就是全国百姓的情绪,去年多条高铁的开通,以及很多过去要出远门到外地打工的人,因为当地经济发展了,留在本地工作,这些因素都让他们感觉交通出行的问题容易解决。这就是我们通常自认为的问题,为何在全国不是这样。大数据的分析,让百姓关注热点更客观、更有代表性了。这就是巨量、海量数据整理分析所带来的不一样的观察视角和内容。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款