优化算法的计算模型是当下推行算法新闻的首要任务,它关系着信息内容的推荐、新闻价值的选择、传媒伦理的履行等。

  The Future Today Institute基于人工智能的发展势头,发布了《2018年传媒业技术趋势报告》,预测了以计算新闻学、算法数据特种部队、音频视频算法等在内的75个技术趋势,由此可见,算法已经逐渐融入到传媒业发展的每个核心环节。那么,站在智媒时代的风口,央媒对算法新闻的关注点在哪些方面?算法对新闻业带了哪些挑战?在人工智能对传媒业的影响下,我们如何通过优化算法构建一个稳定的媒介生态环境?这是本文探讨的关键所在。

  利与弊:算法是敌是友

  对于智媒时代的传媒行业,算法到底是敌是友?在信息分发环节,算法技术创新了信息分发方式,它利用用户画像、文章画像、算法模型等程序实现了信息的精准分发和用户新闻的“私人订制”。“个性化内容推荐”成为新闻聚合类平台的标榜,在我国,今日头条、一点资讯、天天快报等平台对算法推荐的实践,属于创新型信息分发模式,其对传媒业和用户带来的优势和风险并存。

  一方面,算法创新了信息分发机制,它基于内容、大数据资源、用户沉淀三方平台的构建,实现信息的个性化匹配,同时,通过自动化的常规任务,不仅提高了新闻从业人员的工作效率和工作满意度,而且能够帮助用户在海量数据中找到需要的信息,节省用户的搜索时间,并且在一定程度上影响用户的信息消费行为。

  另一方面,“算法风险”是各大主流媒体的关注点,导致新闻资讯平台虚假信息、不良信息、低俗信息泛滥以及隐私权和版权纠纷等问题,同时,算法容易造成用户信息消费的窄化、固化,以及信息内容的浅薄化和低俗化,会进一步淡化媒体的责任意识。算法进驻传媒业后,传统编辑把关人的角色失效,信息分发环节被算法垄断,失去把关人的人为干预,引发了受众和媒体工作者的技术焦虑和本领恐慌。此外,算法平台的信息“搬运”行为还触发了媒体间的著作权争端。人民网在2017年9月18至20日连续发布三篇评论《不能让算法决定内容》《别被算法困在“信息茧房”》《警惕算法走向创新的反面》,点名批评了以今日头条为首的算法推荐平台为传媒业与用户带来的风险,引起了公众对算法推荐的广泛关注。

  议题与方法:主流媒体对算法的关注

  目标媒体的选择。央媒对算法新闻的评论会直接影响公众对算法新闻的认知和看法。2016年10月至2017年10月期间,《人民日报》《经济日报》《光明日报》、新华网、央广网、中新网等6家央媒发表了与算法推荐相关的评论性文本,主流媒体对算法的关注,意味着算法争议实质上是具有公共性的新闻议题。

  研究方法与筛选标准。本文运用文本分析进行探索性研究,以33篇评论性文本为研究对象,通过词频分析和建构词云的路线解析央媒对智媒时代算法新闻的倾向性评价,换言之,从传者即“他者建构”的角度,探讨“算法新闻”在央媒评价视阈下的话题倾向,为算法新闻的研究提供了较为典型的观察视角。

  样本的获取主要是在央媒的数字报或者官网搜索“算法”并进行人工筛选,筛选标准如下:样本主旨大体上与传媒业的算法推荐、算法新闻有关;必须为媒体评论,并非对算法技术的新闻报道;样本需为央媒原创性文章,非转载文章;删除消息头等要素,只留文本的标题和正文。最终,共获得有效样本数量达33条,获取文本共计59254字,具体统计详情见表1。

    

  数据整理与清洗。在操作层面,本研究使用R语言,基于结巴中文分词对搜集的文本进行分词,由于获取文本中含有一些新闻专业词汇,首次分词将新闻类专有词组拆散,此外还出现许多虚词等。因此,本研究对分词进行过滤和重组,加入“用户指定统计词汇(如人工智能、一点资讯、今日头条等)”和“用户禁止统计词汇(如一些、许多、我们等)”,最终获得4076个分词,分词的描述性统计表如表2所示,平均词频为3.67次,最大值为432,最小值为1,超过20频次以上有90个词。

    图1:六家央媒对算法推荐相关文本的词云图

  批评与纠正:主流媒体对算法新闻的评价倾向

  本文通过词频分析发现,词频超过100个的词组共13个,从高到低依次是算法、内容、人工智能、用户、机器、技术、智能、人类、信息、媒体、价值、数据、伦理(如表3所示),在图1词云图中,13个词的大小代表它们在研究文本中的重要程度,在这里,就是6家央媒对算法推荐的关注度。由此可见,算法、人工智能、智能等词是媒体关注的主体,内容、技术、用户、信息、价值和伦理等话题为6家央媒对算法新闻的关注点。

  内容偏见——多元、真实、客观、公正的原则削弱。算法新闻产生的回音壁效应,能够强化受众对某类信息的“固有偏见”。Eli Pariser在《别让算法控制你》一书中指出,互联网服务会根据用户的个体特征、行为和社会关系,创造出一种近乎于虚构的量身定制的现实。换言之,智能推荐或智能排序系统会从一开始就跟踪和记录用户的足迹,根据用户键盘输入的内容、网页检索的关键词以及点击浏览的信息进行精心的调整和过滤,达到信息定制的目的,最终,把用户束缚在一个与其他信息世界隔离的气泡中,让用户沉浸在自己偏好的信息“密室”里。在这个由算法创建的密闭回音室中,相似的意见和信息会不断充斥在用户偏好的信息世界里,让用户的信息接触变得狭隘、单一和固化。

  算法所推崇的个性化并不是新闻专业伦理所推崇的,其推崇的是多元、真实、客观与公正,算法无疑消弱了这些原则的适用性。私人订制使得信息分配机制从多元化到个体封闭化,即“千人一面”的信息平台已经转变为“千人千面”的个人信息世界,内容偏倚已经否定了其多元、客观、公正的原则,算法推荐的信息流中掺杂着大量虚假和低俗信息,用户必然难以摆脱,这就打破了真实性的原则。《人民日报》在对算法推荐的评价中,将其形容为“是强化偏见的囚徒”。人民网刊发的《别被算法困在“信息茧房”》一文中,正视了算法新闻能够将用户桎梏在信息茧房里,这种作茧自缚的得与失是用户过滤自己不感兴趣的信息造成的。此外,央媒从“信息孤岛”理论不断重申意见固化, “技术为用户量身打造信息,开启了符合读者口味的一扇窗,却关上了多元化的一道门。我们或可称之为“孤岛效应”——在自我重复、自我肯定、自我强化中,公众的知识、思想逐渐固化,成为海面上的一座座孤岛。”因此,央媒强力呼吁传媒业“不能让算法决定内容”。技术迷思——工具理性和价值理性的博弈。技术渗透传媒业的背后,当然会带来社会对技术的迷思和批判。德国哲学家韦伯在《经济与社会》一书里提出工具理性和价值理性的思想, “前者意味着发挥技术的最大效用,后者则强调价值、伦理的重要性,”央媒对算法的评价,也主要围绕着工具理性和价值理性的博弈。技术的推动和价值的坚守结合,才是算法自身的价值所在。那么,算法是如何被工具化的?又如何同时发挥着价值理性呢?在技术迷思之下,技术的时代更迭伴随着用户体验后的评价,一方面是肯定性评价,算法新闻更多是发挥了技术工具性的最大效用, “在依靠甚至依赖算法的当下,也可以将更多人工劳动引入其中,看似又回到传统的新闻生产模式,但实际上既发挥了技术的优势,又弥补了存在的不足,实现了人与机器的优势互补。”

  央媒在强调算法实用性价值的同时,也批判了算法对价值理性的忽视,它掩盖不了技术带来的伦理和道德问题。2016年企鹅智酷发布的《智媒来临,2016中国新媒体趋势报告》指出,32.2%的用户担忧个性化推荐会让视野变狭隘,32.6%的用户认为个性化推荐的内容太少,30.7%的用户认为个性化推荐的内容不准,还有29.4%的受众认为推荐的内容太低俗。当我们认真审视算法时,就像对转基因技术和克隆技术的态度一样,一开始保持着对技术的怀疑和批评,但最后会对遵循人类道德伦理的技术以及其创造的一切美好拍手称赞,最重要的问题在于我们如何通过调整算法,实现工具理性和价值理性的最大合力。当然,我们也要深思,算法的控制者是谁?当价值理性缺失时,是媒体还是技术来认领算法新闻引发的伦理过失和承担社会责任?这些问题的解决,需要出台相应的监管机制来把控。

  价值逻辑——新闻价值与商业利益的矛盾。新闻价值是传统新闻工作者进行新闻选择的统一标准,在符合信息的新鲜度和真实性的前提下,新闻选择要遵从信息的时新性、重要性、接近性、显著性和趣味性五个原则。在智媒时代,聚合类新闻平台实行算法推荐的价值评价标准又是什么呢?如果只是靠点击量、点赞和评论来筛选信息,这种价值标准由谁认定和审度?点击量、阅读量等“数”的概念,是算法新闻进行推荐的基本原则,它们代表着受众的信息偏好,算法推荐不断收集用户的这些信息偏好,最终实现信息的准确喂补。算法推荐的信息筛选价值,是顺遂大数据时代和新媒体传播情景生成的,如今,在充斥着冗余信息的自媒体时代,10万+阅读量、1万+评论量、百亿点击率……成为媒体进行竞争的招牌,其最终目的都是为了追逐注意力经济。因此,算法新闻中包含着设计者的价值和利益,聚合类新闻平台利用算法进行推荐,获取更高的点击率,实现经济效益的最大化。的确,新闻价值从五要素到个性化推荐,不再与价值要素挂钩,而是与点击量带来的巨大经济效益等因素关联,既颠覆了新闻选择的标准,又贬低了新闻的价值。人民网刊登的《“算法至上”内容推荐已过时?区块链衍生出新玩法》一文指出, “Primas 使用了全新设计的开放式内容价值评价体系。在这个体系下,对单篇内容的价值评分不再单纯取决于点击量指标进行计算,而是综合考虑了社会化推荐、内容传播和作者信用等因素,从深度和广度两个方面全面衡量内容的价值,按照读者付出的成本从低到高可以排序为点击、点赞、评论、转发、转载。”这对今日头条等新闻聚合类平台,进一步完善算法内容的价值评价体系有一定的借鉴意义。

  算法伦理——让算法遵循“善法”。Eli Pariser在TED演讲中重新审视了算法的伦理道德问题,他指出, “我们将选择权传递给了计算机算法,但问题是,它们并没有人类所具备的道德精神。”算法是没有人性的,它是冰冷的机器。因此,算法伦理和道德的践行主体由新闻工作者变为算法机器,是行不通的。算法机器与专业的新闻从业人员工作职能的互斥点在于,编辑人员具有主观性、能动性和责任感,相反,算法机器是自动化的、冷漠的和无责任感的。

  从伦理学视角,算法新闻应是媒介伦理向技术伦理、数据伦理、算法伦理转变或者结合的产物。《光明日报》关注的是“技术为善”的规则, “作为人工智能时代的道德建构,让算法遵循 善法 的原则包含两个重要的伦理尺度:一是人工智能自身嵌入的道德,涉及人工智能带来的智能主体模式及其相关伦理尺度;二是人类在拓展人工智能的过程中进行的道德建构,涉及常见的人类主体模式以及人类主体与人工智能主体相处的“主体间”模式及其相关伦理尺度。”此外,央媒也关注算法的伦理与价值共同作用下的技术道德,《光明日报》在《怎样提升人工智能的“道德水平”》一文中指出,“数据和算法并非完全客观,数据的采集、标注和算法的设计往往负载着价值。因此,数据解读中的价值取向和算法设计中的伦理考量,是决定人工智能区分道德上‘对’与‘错’的关键。”

  2017年12月9日,深圳,在未来报亭,腾讯的写稿机器人Dreamwriter在写新闻 ,并送给用户一份“未来报纸”。供图/CFP

  观点与讨论:发挥算法与人的最大合力

  算法新闻是“人+算法+新闻”的融合物,在遵守新闻价值规律的前提下,技术也未必是完全的善或恶, “善”与“恶”是技术乐观主义与技术悲观主义两种对立的思想,那么,我们需要用何种视角去看待技术的善与恶呢?在央媒对算法的观点性评价中,无论是将算法对用户的“控制”形容为“信息茧房”“技术牢笼”“技术陷阱”“信息孤岛”“个性化圈套”,还是“算法奴隶”等,我们对技术的反思向度都要追溯到技术与人的关系、技术与社会的关系,从自然辨证法的角度看,技术决定论、社会建构论、技术社会互动论、社会技术整体论等观点的提出,无疑坚定了技术对社会的推动作用,但从媒介发展的角度看,这些技术理论存在一定的缺陷,在此基础上,有些学者提出了“社会技术整体互动论”,核心观点为“技术和社会是一个整体,两者不分立”“技术与社会是互动的”。技术与社会或者人之间的关系就像埃舍尔的作品《互绘的双手》一样,相互“复制”又相互“塑造”,通过“互绘”达到“互惠”,换言之,机器算法的“智慧”是由人赐予的,到头来人类也会享受着技术的“福祉”。

  在智媒时代,技术与人的博弈还在继续,我们考虑的维度不再局限于人本身,更不能对技术嗤之以鼻,要用人的认知能力与思维方式去设计和优化算法,让算法在人制定的规则和范围内正常运行。由此可见,优化算法的计算模型是当下推行算法新闻的首要任务,它关系着信息内容的推荐、新闻价值的选择、传媒伦理的履行等。一方面,优化过滤虚假信息、谣言和信息流广告的程序,让算法程序有效地甄别和抵制垃圾信息,防止流入下一个传播环节;另一方面,优化信息抓取和筛选程序,降低算法分发信息的权重,让编辑加入到信息筛选和分发的过程中,才能将优质的内容发布到信息平台上。此外,针对算法推荐,要强化对算法的规制,加强媒体的监管体制、队伍和平台建设。当然,新闻机构进行算法新闻的实践,不要局限于推崇“个性化”,不要被算法、流量、点击量绑架,反之,要专注于“人文关怀”“正能量”等有深度、有温度、有感情的报道,这才是算法助力于传媒业的正确途径。(张铮:清华大学新闻与传播学院副教授;陈雪薇:吉林大学新闻学系)