网络直播利益链。供图/CFP

    作为一种新兴的商业模式,近两年,网络直播发展迅猛、热闹非凡。花椒、映客、熊猫、微吼、乐嗨等诸多直播平台如雨后春笋,腾讯、新浪、小米等互联网企业和电信企业也纷纷进军这一领域,网络直播已成为2016年最火热的“互联网风口”之一。

    但直播平台乱象丛生、网络直播行业野蛮发展也是不争的事实。文化部712日公布,26个网络表演平台被查处、16881名违规网络表演者被处理。如何还网络直播平台清朗?本文浅析网络直播乱象产生根源及需要管控的对象,并从监管、技术、自律等层面进行初步探讨。

    “蛰伏”后迎爆发式增长

    作为一种全新的信息传递手段,网络直播颠覆着人们观察世界、连通世界的方式,为人们提供了一种看世界的新鲜方式。偌大的直播平台上,体育、旅游、游戏、教育等多元的直播内容层出不穷,无论什么年龄、什么身份的人,都可以前脚跟随主播的镜头,身临其境看车展,体会指哪到哪的便捷,后脚就可以转换频道进入学习模式,和“意见领袖”一起探讨如何培养孩子的情商……丰富而有张力的网络直播内容充满了吸引力,让越来越多的人尤其是年轻人欲罢不能,而其本身的即视感和互动性也迎合了年轻用户的文化消费习惯。

    据行业报告显示,2015年直播行业市场规模约为150亿元,到2020年总规模将激增至1000亿元。当前网络直播平台数量接近200家,网络直播平台用户数量已经达到2亿,大型直播平台每日高峰时段同时在线人数接近400万,同时进行直播的房间数量超过3000个。可以说,网络直播行业经历两年“蛰伏”,正迎来爆发式增长。

    但由于收益模式单一、主播进入门槛低,个别直播平台为获取利润,盯住“很黄很暴力”做文章,铤而走险。从“直播造人门”“直播脱衣门”“百人试套”到近期的“雪梨枪淫秽视频”,表演平台淫秽色情事件频发,更有涉政、涉暴恐、涉赌毒等违法事件发生,网络直播乱象已经严重阻碍了该行业的快速发展。

    利益驱使:导致直播乱象频发

    那么,直播平台乱象产生的根源是什么?让我们从网络直播的产业链进行分析。

    整个网络直播行业的产业链由直播平台、主播、工会、资本、监管机构、用户、第三方服务机构等环节组成。在网络直播过程中,直播平台一般由主播和用户自身及互动行为来构成,通过文字、视频、音频三种渠道传播各类信息。主播、用户是产生网络乱象的“供需”根源,而文字、视频、音频是传播网络乱象的“载体”根源。

    首先是“供需”根源:主播按照播出内容分为秀场主播、游戏主播、泛生活类主播,由于利益驱使,部分主播频频突破社会公德底线,甚至冲撞法律“红线”;随着直播平台的用户持续增长,一些恶意用户开始利用直播平台的高人气和影响力发送不良、违规信息,直接或间接地促进了乱象的扩散。

    其次是“载体”根源:网络直播业务中文字分为UGC类(主播头像、主播昵称、频道名称等)和弹幕类(消息等),尤其是弹幕类内容具有传播速度快、范围广、违规内容变化快等特点,依靠传统“关键字+人工审核”模式不能有效解决内容安全问题目前视频审核的模式是对视频做抽帧截图处理,然后通过图片识别系统过滤,这个方式存在对违规图片识别准确率不高、通过抽帧截图发现问题后立即关闭直播频道也难以挽回影响的问题;直播业务中音频内容监管难度大,目前还没有直播平台针对语音内容进行识别,语音内容违规现象频发。

    此外,还存在直播企业缺少回溯技术手段以及应急保障机制、审核团队能力欠缺,特别是对涉意识形态问题经验欠缺等问题。

    对策完善内容安全建设

    要想维护网络直播领域的清朗,需要政企双方共同合作,在监管和自律两方面双管齐下。

    在北京市网络文化协会的组织下,2016413日,百度、新浪、搜狐、爱奇艺等20余家从事网络直播的主要企业负责人,共同发布《北京网络直播行业自律公约》,并逐步建立“黑名单”制度,在自律方面做出了榜样。

    而在监管方面,从目前直播内容依旧频繁违规的现象看,依靠单一的文字识别或者图片识别是不足以解决内容合规问题的,还需要一套完整的内容安全体系。因此,可以借力“人工智能”和大数据技术,打造以安全运营为核心的内容安全体系,从事前、事中、事后三方面进行整体监管。

    首先是事前预防。“防患于未然”是治理“直播乱象”的重要基础,直播平台、监管机构要共同对主播、“网红”、用户等参与方加强宣传引导,树立互联网良好风气;在技术上,直播间增加水印,实行主播实名制、用户实名制等。

    其次是事中管控。消息、视频、音频、主播信息、用户信息等渠道都可以传播违规内容,因此“事中管控”需要包含文字识别、图片识别、音频识别、UGC内容识别以及用户行为分析等技术。具体来讲包括以下四点。

    文本识别:传统文本识别技术主要包含关键字过滤、语义分析、文本指纹等技术以及近期新兴起的基于自然语言的“人工智能”技术。这些技术各有利弊,在不同场景产生的效果不尽相同,需要组合应用才能降低文本信息的风险。

    图片识别:该技术模拟人脑的神经网络学识别图片,通过大量图片训练后给图片打分。主要应用于在图片中识别文字、识别人脸、识别色情信息等三个场景。在直播领域通过抽帧截图的方式把视频变成图片,然后通过图片识别的方式判断视频内容是否合规。

    语音识别:该技术就是让机器通过识别和理解过程把语音信号转变为相应的文本。在直播业务中我们利用该技术把主播声音转化成文字内容,然后通过文本识别的方式判断语音内容的合规性。

    用户行为分析:基于大数据分析技术,是文字、图片、语音识别技术的有力补充,也是识别违规内容的重要手段之一。例如当一个直播间出现人流量激增、打赏礼物激增等行为时,可以采取加大监控力度等措施

    第三是事后追溯。治理直播乱象仅仅依靠技术是不够的,加强法律震慑、提高违法成本也十分重要。例如近期执法机关对违规主播进行依法打击,就产生了极大的震慑作用,在一定程度上遏制了网络乱象的持续发酵。

    治理网络乱象不能一棍子打死也不能期望一蹴而就,需要多角色多岗位的长时间磨合。在技术上更需要建立一个完整的内容安全体系,而不能仅依靠某个手段就事大吉。(刘建东:北京国信安石科技发展有限公司总经理)