什么是大数据?它有4个特征:数据量大、多样性、产生速度快和价值密度低。随着互联网的快速发展和广泛应用,产生了海量数据。相对于传统数据而言,这些数据体量极大,数据源繁杂多样,容纳大量图像、文字、网页、音频、视频等,因而被称为“大数据”。

  传统数据技术已经无法处理大数据,于是,大数据处理技术应运而生。目前通用的大数据处理技术是具备海量处理能力的分布式计算系统。它拥有巨量的数据存储能力,以及由强大的中央处理器、图形处理器和专有芯片构成的计算集群。这些数据处理工具可以做到6小时内处理100PB数据(相当于1亿部高清电影),每秒处理7.8万张图片。而在底层存储计算能力之上,是自然语言、计算机视觉和语音等技术。有了它们,机器能更好地学习、理解和处理复杂数据。

  在文艺创作领域,人们对数据背后规律的探寻,早在互联网时代到来之前就已开始。比如,电影行业对票房、排片率、上座率等数据的关注。但直到互联网大数据出现,在线文艺作品最后的“黑匣子”才真正打开。如今,所有观影数据、用户交互数据、播放表现、演员等构成一个庞大的数据系统,通过人工智能的分析,量化成一些固定指标。这些指标可以在一定程度上反映用户面貌,已经广泛为采买、制作、投资、宣发和播放各个环节提供参考。

  比如,“选角”是大数据应用的一大场景,大数据算法可通过舆情数据提炼出网友对演员的评价标签,计算演员和候选角色的标签相关性,网络剧《长安十二时辰》中张小敬的扮演者就是由大数据参与推荐的。除了选角,大数据还能指导剪辑。观众对视频的观看反应,比如何时拖动视频进度条快进等等,都会纳入监测范围,从而让制作者对观众喜好判断有据可依。而在重大体育赛事中,机器甚至可以智能生成精彩短视频(如进球瞬间),直接成为内容生产的一环。此外,在“千人千面”的分发机制下,不同用户在视频平台看到的首页是不同的。就算是看到同一内容,其封面图和推荐文案也可能是量身定制。

  大数据对文艺创作的指导作用到底有多大?一段时间以来,一直存在两种截然相反的观点。一是将大数据描述为文艺创作的“爆款炼金术”。伴随网络视听的迅猛发展,竞争越发凸显,为了从中突围,制作方对于“爆款”的追求较以往更甚。用数据说话,一定程度上可以消除节目反馈“不确定性”,提升“爆款”命中率。另一种观点则将大数据置于艺术家“创意”“灵感”的对立面,认为技术探索在文艺创作者的智慧面前显得虚妄。这两种观点都失之偏颇,文艺作品具有特殊属性,用大数据描绘它的难度远高于一般商品,但否认科技与艺术在当下深度融合的趋势,同样不可取。事实上,5G、人工智能、虚拟现实、超高清显示等新技术无一不在深刻影响文艺发展。

  因此,应合理认识大数据在文艺创作中的参考价值,善于利用而不是一味追捧。通过分析数据,有助于了解观众喜好和习惯,认识当下艺术潮流、创作方向,从而为创作提供参考。大数据和人工智能的结合应用,甚至可以将人力解放出来,使创作者得以腾出更多精力,投入到不可替代的精神创造中去。

  但大数据提供的参考仍然是有限的,观众浅层的娱乐需求容易归纳,更深层次的文化追求和价值取向却不易探究。“爆款”没有标准计算公式,一部文艺精品诞生依靠的是艰苦创造和不断创新。如果本末倒置,以为集纳了大数据推荐的流行元素和吸睛话题就高枕无忧,没有在打磨作品上下足够功夫,是不可能创作出优秀作品的。此外,对大数据的过度依赖,容易带来统一标准趋向下的跟风与同化,使作品缺乏艺术个性和创新。以《中国诗词大会》为例,如果单凭大数据监测,“诗词”算不上热门元素,但节目传达出的优秀传统文化内涵与质感,仍使它赢得观众喜爱,节目的模式创新和创作者的文化坚持才是作品的核心竞争力。

  大数据不能取代人的创作,但它可以在文艺创作生产各个环节提供有益参考,赋能更多好作品。随着社会发展和科技进步,未来大数据的应用前景将更为广阔。比如,随着数据维度不断细分,越来越多内在创作规律将被大数据挖掘出来;而随着更有效的技术手段和认知框架的引入,在原来“大数据”基础上,可以生产出更多“好数据”,比如在性别、年龄等人口统计学数据之外建立心理学标签,和原有数据整合,就能形成观察用户的一种“好数据”。从存储计算到高度定制化的运用,相信只要我们善于利用,大数据将为文艺创作发挥更多积极作用。(庄卓然)