登录
首页数据新闻与大数据思维的应用
数据新闻与大数据思维的应用
2016-02-19
收藏

数据新闻与大数据思维的应用

数据新闻到底是什么?它与数字新闻、大数据运用有何关联?“大数据新闻”为何不是一类新闻?程序员、统计师能取代记者吗?

数据新闻如今已经风靡世界,成了新闻业界创新的法宝。数据新闻利用数据挖掘可以延伸新闻中单一事件、现时信息的意义,拓展新闻的时空范围,深化对新闻事实的认知,发现常规新闻中不能体现的逻辑,从而丰富了单篇新闻报道的内涵,新闻样态也从封闭式告知话语转换为开放式工具,用户可以使用这些工具获取多元的信息。

但是,数据新闻到底是什么?它与数字新闻、大数据运用有何关联?“大数据新闻”为何不是一类新闻?程序员、统计师能取代记者吗?对数据新闻的认知中,还有相当多的认知误区;数据新闻也有被滥用之嫌,其实它不是万能的;数据新闻也有其困境,它的内容和形态有着局限性。因此,本文将结合案例廓清相关概念,分析并大数据思维在新闻中的应用及其局限性。


一、   用了数字图表,为什么还不是数据新闻?

近两年大数据成为时髦,不少媒体就以简单的数字统计,来充当“数据新闻”。但是,只列有数字,那还不是数据新闻。关于数字、数据、大数据,数字化与数据化,数字新闻与数据新闻等概念,目前还存在一些混淆的情况。

“数据”不等于数字,也不一定是数字,它是对事件的一种描述,数据可以记录、分析和重组事件。“大数据”不只表示数据量大一些,它是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。它的特点是:数据量大,数据类型多样,处理速度快,价值密度低。

“数据化”简单地说,是把现象转变为可制表分析的量化形式。“数字化”是指把模拟数据转换成0和1表示的二进制码,从而使电脑可以处理那些数据。[1]

“数字新闻”(Digital journalism)是指对文本、图片、视频等进行数字化,从而通过互联网技术能传输的新闻报道。“数据新闻”(Data journalism)是指用数据驱动的新闻,是内容量化了的报道,是用数据作为表述形式的新闻。数据新闻很少是以大数据驱动的。“大数据新闻”其实并不能成为一类新闻,而是以大数据的思维和工具做成的新闻,是将大数据思维内化到生产实践及样态创新之中。是基于互联网及其衍伸技术平台实现的以大量数据搜集与分析为主要工具,而生产出来的新闻,主要是数据新闻,通常是以图表等形式,通过对一系列的简要事实的相关性的表达,揭示出事实背后的意义。因此,目前一些媒体以简单数字、图表罗列的新闻,并不是数据新闻。


二、     为什么专业新闻工作者是必要的?

随着自媒体的出现,专业记者将不再需要的议论甚嚣尘上。如今数据新闻又催生了一些新的报道者,比如“程序员记者”,即计算机程序员因为其技术的使用,成为了报道者,比如美国《芝加哥论坛报》之“犯罪新闻”(Crime in Chicagoland)网页的程序员;“统计师记者”,即懂得统计的工作人员当上了信息报道者,比如博客“FiveThirtyEight” 博主内特·斯弗(Nate Silver)。[2] 那么专业记者还有存在的必要?当然还是需要的,只是对专业新闻工作者的要求变得更高,他们不仅要理解统计、设计,而且要有新闻专业的敏锐性。

数据本身并不具备多大的新闻价值,有时数据带有欺骗性,需要记者从纷繁复杂的数据、报道中寻找灵感,去发现其中的意义,发掘新闻的深层或新鲜的价值。举例来说,股票行情天天向所有人公开,密密麻麻的名称中,某一只股票的价格,在什么情况下会有比较大的新闻价值呢?彭博新闻社就从中找到了独特的新闻价值。彭博的记者通过对过去十年在上海证券交易所交易的股票进行分析,发现贵州茅台酒业股票自2002年11月至2012年10月,十年间上涨达3451%,市值从不到10亿美元到如今的410亿美元,成为世界第二大造酒公司。这算是一个很好的发现,具备了新闻价值的“新鲜性”。其中还有什么意义呢?这些数字是中国经济发展速度的证据之一,它也表明中国的经济发展带来的社会变迁:中国经济十年来的发展,已经造就了一个富裕阶层,他们对奢侈品类的需求,刺激了相关消费,因此出现了茅台酒及其股票的大幅增长。因此新闻又有了“重要性”价值。重要性还可以在扩大吗?是的,时值中国十八大期间,通过数据挖掘报道的中国经济发展及其影响,“重要性”价值就更大了。其实我们也可以把上述新闻看作是一个独到的对中国十八大的解读,因为要报道十八大,所以才有了记者的各种想象和挖掘。一位单纯的程序员、统计师,是很难发掘出这样的新闻价值的。

与传统的新闻形态相比,数据新闻为单一事实或信息提供更多的表述可能、更深的逻辑关系、更大的想像空间。用数据新闻的引领者彭博新闻社的负责人的话来说,是一种“简单而优雅的呈现观点以及点燃想象力的”的方式。[3] 如何才能点燃用户的想象力?需要专业工作者具备更全面的知识和能力。


三、大数据思维的新闻更科学更有效吗?

传统的新闻是哪儿来的?也就是新闻判断是如何形成的?是依靠新闻记者的新闻直觉、新闻敏感——有一种叫叫news sense的意识,它是有赖记者的知识、水平、经验、视野而形成的一种意识,虽然是来自客观世界,但是也不排除“先验性”。在西方的新闻教材里,就有新闻鼻(news nose)、新闻眼(news eyes)之说,有些记者的五官更灵敏,从一些小细节能“嗅”到多少英里之外的新闻。 某著名央视新闻主持人曾说起类似的判断:某中国文化人士在国际上获得了顶级大奖,百年一遇,央视编辑据此判断,这条新闻应当最吸引人,因此即将此新闻置于栏目中的靠前位置。但是之后的收视率却发现,该条新闻的收视曲线是迅速下降,到后一条才又抬起。

大数据思维主要包括三个方面,即:总体样本取代随机样本;对不精确的容忍度增加;相关关系取代因果关系。[4] 那么大数据思维下的新闻判断,是如何形成的呢?这里仅以其第一方面——样本的总体性思维来说。

传统的新闻是在记者的新闻敏感的基础上判断、采集发布的。记者认为这件事、那件事很有新闻价值,对社会的多数人会有吸引力和影响力。一般记者只会以个别人物或事件作为采访对象,并通常认为这些事对多数人有意义。这是用的“随机样本”的方式,进行的新闻工作,其中包含了偶遇式新闻采访(如“街采”)、先验式的新闻敏感。而大数据思维则有能力获取“总体样本”,通过分析所有用户的需求和兴趣,从而得出新闻价值的判断。

比如2014年春节前后,中央电视台《新闻联播》编辑部做的“据说春运”、“据说春节”,即是以百度的搜索大数据为基础做的系列报道,它呈现的不只是炫目的可视化数据信息,不只是新闻形态的一种改变,而且还从大数据中找到做新闻的点,展开关于春运、春节的故事。内容的选择不再只是传者视角的单方面揣测和传说中的新闻敏感,而且融入了用户的需求,基本上是点餐式的服务。设想一下,这样的新闻不仅与信息接受者之间形成了内在的互动关系,而且带活了内容,真正是贴近了受众,而且也对传统媒体的年长化、老龄化的受众形势,有积极的干预效果,能够吸引更广大年龄层面的受众。

大数据思维带来了新闻内容的创新,是一种融合媒体的形态驱动的新闻生产的创新。融合媒体的概念,在80年代是关于技术形态方面的,90年代进入了产业化层面,如今进入用户层面的迁移或者迁徙,是更新的融合。用户层面的迁徙,最终会引发内容的融合。通过大数据找到了特别贴近用户的报道话题,这些话题实际上是网民们感兴趣的。网民集中于45岁以下、甚至更多为18岁到35岁之间的人群,他们不是传统意义上的报纸读者、电视观众。他们带动传统媒体的话题年轻化了,实际上是网民参与了新闻生产,必然逼迫内容要进行改革,所以大数据思维带来了从形态到内容上的新闻创新。


四、大数据在新闻中的应用及其困境

大数据时代,数据新闻不只给新闻工作者提出了更高要求,也给政府、社会、媒体机构带来了挑战。一些媒体已经在不断开发新的工具,来满足数据新闻的需求,比如英国《卫报》、美国《纽约时报》不仅在扩展自己的数据库,而且在技术上也提供了许多可能性,尤其是开源的方式,给用户提供了工具、也让用户带来了丰富的数据。《华尔街日报》开发的“中国经济追踪器”,就是一个中英双语的数据新闻工具,它为中国的读者和记者提供了便利,特别“为那些与中国经济数据斗争多年焦头烂额的外媒记者指了一条明路。”[5]路透社香港分社为报道中国政治换届,曾推出“关系中国”(Connected China)平台,他们从中国政府官方网站和出版物、中国及世界媒体报道、外国政府分析报告、学术论文等多渠道汇聚到上万个权利实体(机构和个人)、三万余条关系、150万文档(相当于20本非虚构类图书)的数据量,将海量数据划分为“社会权力-关系网”、“机构权力-党政军机构人事流动”、“职业比较-行政级别升降”三大主题,开发基于HTML五代技术制成的数据、图片、文档和视频无缝链接的平台。

传媒机构可以从以下渠道获取数据:与政府、企业、科研机构等部门实行数据共享,并通过新闻监督职能不断推进“数据公开”运动;网络数据(特别是社交媒体数据)的筛选与使用,这类社交媒体信息过滤工具能够帮助记者在突发性灾难中通过现场勘探施救人员和志愿者的社交账号,筛选并核实新闻事实;传感器数据的捕捉及挖掘。传感器装置逐渐普及到人们日常生活中,形成的数据网络,美国NPR记者就开始由此探索记者自己编织数据库的潜能;将媒体既有的资料数据化;学术数据再利用;自行展开调查搜集数据。


值得一提的是,大数据的应用不是万能的。首先大数据是掌握在少数权威机构、信息服务商的手里,对于大多数媒体机构来说,是很难获得的;第二是新闻记者个体,不仅难以获得数据,而且如果没有集团式的操作团队,也难以充分分析、呈现大数据;第三是大数据思维本身的特质,在某些方面与新闻的特质是相悖的。大数据本身就是不精确的,这与新闻的精确性要求相悖;大数据是整体样本的,这又与新闻的追求个性化、独到相悖。当然,媒体机构与新闻工作者也可以化不利为有利,比如从不精确的总体样本中发现趋势和规律,从中找到自己的个性化的新闻点,并且通过精确的信息衍生出自己的故事。

数据分析咨询请扫描二维码

上一篇
下一篇
客服在线
立即咨询