数据新闻,狭义来讲就是“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。”目前,数据新闻在全球掀起一股社会浪潮,深刻影响着新闻界的未来发展方向。我国媒体和高校对于数据新闻的研究和实践起步较晚,认知和实践水准远低于西方媒体,但近年来发展如火如荼。在2014年习近平总书记发表的关于媒介融合的战略思想的推动下,甘肃省融合媒体研训基地分别于2015年6月和2016年5月开展了首届、第二届中国数据新闻大赛以及数据新闻研讨会,并得到了海内外的高度关注。本文以对两届大赛作品的对比分析,从五个方面梳理数据新闻的发展路径,并提出一些建议。

  议题设置:中国问题由本土化向国际化转变

  为方便作品对比,报道议题被设置为七个类目,分别为经济、文化、社会、政治、环境、教育、其他。首届作品在不限主题的前提下,共收到86份来自学界、业界广泛参与的数据新闻作品。其中,社会新闻(34%)是报道的主要关注领域,其次为文化新闻(22%)和政治新闻(12%)。第二届作品则以紧密结合“一带一路”战略宣传为报道要求,提倡利用数据新闻讲新丝路故事,以轻松的方式为读者解读政府理念,共收到60份选题针对性强的作品,经济新闻(22%)占据主要报道关注领域,其次为文化新闻(11%)和其他(10%)(见图1)。

  而首届作品的议题大多是某一段时间内全球媒体共同关注的新闻点,比如“PM2.5溯源”“当我老了,我是否老无所依”等社会新闻以及“互联网和我们”“出境游·2014年中国人都去哪里玩”等文化新闻;第二届作品的议题基本上是关于中国问题的国际化传播,将公众利益放置于国际背景下,寻求事件与个人的关联。如“下一个世界工厂在哪里”通过呈现与公众利益直接相关的中国及“一带一路”沿线国家的人口状况,预测下一个因人口红利而成为世界工厂的国家。

  数据质量:新闻透明度和价值意义得到提升

  在国内媒体环境下如何寻求、收集并处理庞杂无序但又异常重要的数据,运用数据的对比形象地说明问题,是数据新闻研究和实践中的关键所在,因此,数据质量至关重要。

  第一,数据来源。通讯社、以往报道或出版物(通讯社、以往报道或者其他出版物中公布的数据)以及政府、政府组织(政府在政府信息公开网站或政府报告中直接公布的数据)均为两届大赛作品尝试与探索的数据来源,而且呈现稳步上升的趋势,通讯社、以往报道或出版物(96%)以及政府、政府组织(77%)在第二届作品中占据垄断性地位(见图2)。

  第二,数据分析。结论是否经过数据推演(结论收到数据支持)、数据是否来自一个以上的出处或数据集、是否对比论证(反面例子)成为检验一则数据新闻能否进行深入分析和解读的主要维度。第二届作品对数据的分析(结论收到数据支持、数据集、反面例子)比首届有一定比重的上升(见图3)。

  第三,数据应用。如何应用客观冷静的数据分析结果对受众关注的事件予以科学解读,深入寻找相关关系和内在逻辑,彰显数据的内在价值,是数据应用是否得当的关键所在。两届作品中,数据和报道内容相关性均较高,分别占87%和96%;在数据的处理方面,第二届(57%)处理数据的能力略高于首界(48%);从数据整体质量来看,第二届(54%)作品的数据透明度和可信度略高于首届(44%)(见图4)。

  第四,数据表现。数据的表现形式直接关系到用户对于数据新闻作品的理解。根据统计分析得知,首届和第二届作品中的可视化易懂所占比重分别为84%和89%,可视化易懂是指数据新闻的可视化设计“一眼”就可看明白。例如,可视化包括相关描述性文字(横纵轴标题清晰)、无拼写错误、字体一致、单位正确等。

  设计呈现:方式趋于多元化和互动化

  与传统新闻报道相比,大数据时代的数据新闻越来越注重版面设计的交互性以及创意的表现,其接收的信息和视角可由受众自行定义,将受众带入新闻,受众的自主性和个体性得到实现和尊重。同时,提高了新闻报道的精度,尽可能为受众呈现全貌。据统计得知,首届作品以静态信息图表(53%)为主,第二届作品则以静态信息图表与动态交互式信息图表二者结合(59%)为主(见图5)。

  例如,首届作品中,“PM2.5溯源”“出境游·2014年中国人都去哪里玩”等主要通过简洁明了的信息图表可视化呈现数据的关系,勾勒了所要表达的内容。第二届作品中,“数说‘钢铁丝路’:连接亚欧大陆的中欧铁路”主要通过两张大地图形式进行视觉呈现,运用了魔镜这一可视化数据分析平台,用符合数据自身规律特点的各式图表呈现不同的数据价值。

  技术运用:新闻业务更为精细化

  首先是数据挖掘和分析工具。数据新闻的探索和实践要求在大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的且有价值的信息和知识。首届作品主要以Excel(85%)、其他(41%)、SPSS(19%)、Tableau(18%)为主,第二届作品则主要以Excel(98%)、Tableau(23%)、SPSS(21%)、Python(21%)为主。其中,其他数据挖掘工具主要有R语言、orange、Mahout、import.io、八爪鱼等(见图6)。由此可见,数据新闻制作者使用多种多样的数据挖掘工具,Excel、Tableau、Python的比重有所上升。

  其次是数据可视化工具。与传统新闻相比,数据新闻的可视化通过对海量复杂数据和地理或者时间等相关信息以兼具形象化与趣味性的信息图表的方式展示给用户,化抽象为具象。首届作品主要以其他(68%)、Photoshop(51%)和百度图说(39%)等工具进行可视化,第二届作品则较多地使用其他(46%)、Photoshop(45%)和Echarts(36%)。

  叙事方式:讲述故事的能力有待提升

  英国《卫报》数据博客的编辑西蒙·罗杰斯认为,“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事,只是有时故事是用可视化效果或地图来讲述。”据统计,首届作品(23%)通过大数据讲述新闻故事的能力比第二届作品(19%)略胜一筹,但不能忽视的是,在如何选取最佳角度呈现数据、受众之间的相关性、故事化叙述最有价值的新闻这一点上,依旧还有很大的提升空间。

  首届作品中,“古人是怎么避暑的”“如果这都不算爱,央妈心里好悲哀”“买房OR炒股”通过趣味故事的形式将枯燥无味的数据与受众的关联呈现出来,达到了很好的传播效果;第二届作品中,“数说敦煌”通过大数据来讲述敦煌丝绸的艺术故事,将人文故事性与科学性相结合,具有一定的开拓性。

  不足与反思:五建议促数据新闻更好发展

  首先,从议题的选择来看,数据新闻的关注范围虽然逐渐拓展为更多地与世界进行接轨,立足本国、放眼世界,但最关键的还是如何在议题的选择中找到事件与受众个人的关联,即新闻透明度。

  其次,从数据质量来看,数据既是数据新闻的资源,也是数据新闻表达的工具,因此,数据新闻呼吁公开的数据集来提升公信力。此外,还需制作者以开源的理念让受众主动参与进来。

  第三,从设计来看,制作人员均能较好地使用多种设计方式(精美的图表、动态地图、示意图、解释性插图),但不能忽视的一点是,传达给受众的信息是否准确。因此,在创建图表时除了设计还有一个关键性的步骤——确保提供给公众的信息是准确的。

  第四,从技术运用来看,借助音频、视频、图像等可视化辅助工具,数据新闻作品最大限度地综合了受众的感官,提升了受众的沉浸体验。因此,复合型人才和团队协作成为数据新闻获得广泛智慧与技术支持、注入成熟且高质量内容的必备要素。

  第五,从叙事方式来说,在大数据时代,数据可视化只是新闻叙事化的实现工具,最关键的还在于新闻故事本身与其内在的逻辑结构。如何让受众更深入地认知新闻事实,还需要制作者不断发掘有深度有价值的新闻故事,提升用户的个人体验,避免给人碎片化、快餐式的错觉。(文 / 陈积银 刘颖琪)