如果要评选2016年最火爆的互联网产品,一定非直播平台莫属。据相关数据显示,截至2016年底,大大小小的直播平台已经达到300多家。然而其疯狂扩张、野蛮生长的同时也滋生了很多问题,部分直播平台传播色情、暴力、谣言、诈骗等信息,违背社会主义核心价值观,特别是给青少年身心健康带来了不良影响。

  鉴于此,直播平台也采取了多种措施监管主播行为,比如斗鱼就推出了12分主播扣分制系统,并完善了相关举报机制和直播间管理方法,以维护平台的健康秩序。除了主播层面,弹幕作为直播平台拉动主播与观众最主要的互动方式,作为满足用户社交需求的最重要的手段,问题也非常突出。基本上,所有直播平台或多或少都充斥着黄暴、骂战、恶意刷屏等违规弹幕,严重影响了用户观看直播的体验,传递了不良的社会价值观,影响了直播平台的声誉,使企业随时面临风险。目前尚未见到直播平台有明文的弹幕管理方案出台,亟待政府部门加强监管引导;直播平台自身也要提高重视,从技术、人力、机制等方面加大投入,屏蔽违规弹幕,保证绿色健康发展。

  2016年11月4日,《互联网直播服务管理规定》由国家互联网信息办公室发布,第十一条明确规定,“互联网直播服务提供者应当加强对评论、弹幕等直播互动环节的实时管理,配备相应管理人员。用户在参与直播互动时,应当遵守法律法规,文明互动,理性表达。”互联网生态复杂多变,一个行业要长足发展,必然需要走向规范。睁一只眼闭一只眼的时代已经过去,自觉遵守行业法规,做好自身的内容监管是每个直播平台应尽的责任,也是其健康良性发展的根基。

  违规弹幕处理的特点与难点

  数量庞大。直播过程中,观众除了被封禁或者禁言外,都可以通过手机、Pad、PC等设备不限条数、不限地点地随时发弹幕。调侃聊天,参与互动,弹幕可以围绕主播以及主播直播的内容展开,也可以发散开去,天马行空,聊完全不相干的话题。发送弹幕的便捷性及互动内容的随意性决定了热门直播间的弹幕数量非常庞大,部分主播的直播间观众开启弹幕后可能都完全看不到画面。

  实时性。弹幕之所以叫弹幕,就是因为它一发出来就从屏幕上像子弹一样一闪而过。目前绝大多数直播平台的弹幕都是实时的,这种实时性要求弹幕的违规处理必须前置,根据规则进行过滤,不进行展示,才能达到完美效果,后期发现了再处理只能是补救措施。这种实时性的需求也加大了弹幕管理的难度。

  隐蔽性。现在的弹幕形式多种多样,可以发在不同的位置,用不同的颜色,也可以通过代码制作一般弹幕无法做到的功能和形状。部分违规弹幕往往同大量彩色弹幕一起出现,或者出现在比较不引人注意的位置,逃过审核人的审查;有的甚至在发违规弹幕时增加房间的弹幕厚度,或者先发一些高级弹幕干扰巡查审核人员。

  文本的不规范性。弹幕作为一种青年亚文化的表现形式,其语言的表达往往过于随意,无标点,且存在大量非传统字典所包含的词汇,这在很大程度上增加了机器通过语义和字典匹配来进行机械切分的难度。

  弹幕管理的正规化与标准化

  直播大战硝烟弥漫,比内容,比产品,更是比谁能更早一步迈向正规,走向规范。任何行业都有标杆,都有标准,而最先走向正规、走向规范的那一拨人就是标杆,就是制定标准的人。弹幕管理的正规化、标准化正是其中的重要一步。

  首先是技术过滤。包括敏感词拦截、词库过滤、按用户屏蔽弹幕、规则引擎以及文本挖掘、语义分析等。

  敏感词拦截:目前几乎所有的直播平台都有自己的敏感词库,系统自动通过敏感词匹配达到拦截违规弹幕的目的。事实证明敏感词拦截是非常有效的弹幕管理方式,从斗鱼TV每天的弹幕拦截记录及拦截处理记录都可以看出,敏感词弹幕的拦截量非常大,占到整站拦截弹幕的90%以上,且准确率极高,被系统误拦截的情况比例极小。但是敏感词过滤的缺点也很明显,其查全率完全依赖于敏感词汇的丰富程度。除了积累大量的敏感词外,敏感词的同义词、近义词、变形变换词都需要长期积累,不断更新。对于初创建的直播平台,敏感词库从无到有,从少到多,需要一个长期的积累过程。

  词库过滤:弹幕中除了有明显违规的敏感词外,还充斥着大量毫无意义的特殊字符。这种内容虽然无伤大雅,但是却极大地影响了用户对平台的评价,进而选择弹幕质量更高的直播平台观看。通过过滤词库虽然能够将弹幕中匹配的字符过滤掉,留下有实质意义的文字,但是很容易误伤高级弹幕,使得高级弹幕不完整,意义无法识别;很多特殊字符在弹幕文化的语境中有其独特的情感含义,有的甚至有实际的意义,过滤后弹幕语义会发生改变;过滤词库仅过滤匹配的字符,弹幕的其他内容仍然保留,一般也没有合理的方式通知用户,用户会误以为系统有Bug(缺陷或问题);同时,过滤词库跟直播平台畅所欲言的自由特质略有冲突。所以使用过滤词库需要慎重,每加一个字符都要认真观察。

  按用户屏蔽弹幕:系统对黑名单用户弹幕全部屏蔽的做法也是直播平台弹幕过滤较常用的做法,甚至有的会有用户禁言黑名单。同敏感词库一样,黑名单的建立也需要运营人员长期摸索,不断发现,并不断更新修正。斗鱼TV除了支持按用户黑名单屏蔽弹幕,也支持按IP屏蔽,通过多种方式保证弹幕安全。

  规则引擎:据了解,Acfun、哔哩哔哩在前端页面对用户开放了通过正则表达式屏蔽弹幕的功能。其实规则引擎也可以应用于直播平台整个弹幕管理中。违规弹幕总免不了呈现出某些规则特性,通过一段时间的审核处理实战,要发现这些规则并非难事。比如打人弹幕,常用表达是“不管怎么样打了再说”“总之先打一顿再说”“不管这些了,打了再说”……其规则就是先出现“打”字,然后跟着出现“再说”,考虑到“再”字可能很多人会写错,所以这个正则的表达式可以为:打.*[再在]说。规则匹配相对关键词来说,更具精确性,可以达到更加细化的匹配效果,但是对运营的要求更高,运营除了要总结违规弹幕所呈现的规则,还需要学习正则表达式,并根据匹配结果调整表达式,减少误伤。

  文本挖掘、语义分析:随着近年来数据挖掘的迅速发展,文本挖掘也在部分大型互联网企业中受到重视,开始逐渐应用到数据推荐、垃圾信息处理中。通过文本分词、词性标注、句法结构分析、词位置分析等手段,结合大数据的算法实现对垃圾弹幕、涉黄涉政弹幕的分析识别也是未来弹幕管理的大方向。其最大的缺点在于需积累大量的特征词库,且需要专业的文本挖掘技术人员进行长期的研发,相对来说见效较慢。

  其次是人工审核。任何时候,技术都不是万能的,人对于价值观的辨别、社会局势的把握、大事件的捕捉要远远强于机器,这就决定了人对于违规弹幕的敏感度要远远高于机器。对于系统拦截的弹幕,需要人工进行审核,以判断拦截是否合理,对于不合理的拦截要及时解除屏蔽。更重要的是,人可以补充技术的不足,及时发现系统没有拦截的违规弹幕,并进行处理。人工审核除了对技术过滤掉的弹幕核查真伪,查漏补缺,最大的意义在于提前发现言论中不当的引导苗头,及时预防。机器无法判断哪些弹幕具有煽动性,哪些言论容易引起骂战,哪些主题容易引发危险……这才是人工审核可以发力的地方。斗鱼TV大量的审核人员都是在做这方面的工作,他们一旦发现弹幕在朝着混乱、骂战等方向发展时,都会及时调解制止。

  再者是建立机制。现在所有有资质的直播平台都要求有举报机制,弹幕举报在整个用户举报中占了非常大的比例。为了提高举报率,利用热心用户来净化直播间环境,直播平台的举报用户(用户头像、昵称、弹幕)功能需简单、易到达、易操作。因此,建议适当采取举报奖励机制,为了减少因为要奖励而随意举报的可能性,可以对有效举报与无效举报区别对待。斗鱼TV对弹幕的举报非常简单,点击发弹幕的用户,选择弹幕举报即可,对于参与举报的热心用户也给予“鱼丸”奖励,只是手机端受限于屏幕操作的限制,相对PC端来说,操作较难定位。

  最后是平台调性与文化引导。除了相关监管部门要加强引导教育以外,平台本身也要提高自己的品牌调性,加强对弹幕礼仪的引导、规范。现在的直播平台虽然多,却被很多人诟病其雷同,但是研究排名前几位的直播平台可以发现,每个平台都有自己独特的调性,而这种不同调性也表现在弹幕上:映客极简的设计、全民直播的理念、对健康绿色直播的提倡都使其弹幕的文明程度优于其他平台;Acfun、哔哩哔哩作为老牌的视频弹幕网站,已经形成了自己独特的弹幕礼仪规范,弹幕的整体质量较高。

  游戏、美女、土豪是直播平台绕不开的话题,在这种主题的影响下,直播平台整体呈现出低俗、低级、低龄的倾向。这种调性下就算平台加强引导,也不可能让弹幕温暖起来、健康起来。在这种普遍调性不高的情况下,如果有直播平台能够区别于其他平台,开始注重调性的塑造,关注真正有文化、有素养的直播内容,对受众有实用价值、教育意义的主播给予大力推荐支持,并引导用户关注,使用户不仅能在平台获得娱乐的满足,也能获取知识,提高素养,同时也慢慢提高用户弹幕互动的质量,将会是一条良性的可持续发展之路。因为一个直播平台的调性是健康的、高雅的、文明的,直播的内容是积极的、有价值的,其必然也会吸引高质量、高素质的用户;就算素质不高的用户使用该平台,也会因为找不到同类而收敛其发表低俗弹幕言论的欲望,同时也会为了获取认同感而提高自己的发言素质,与平台调性、其他人的品位保持一致。当然,一个品牌的调性不是一两天就形成的,也不是一成不变的,就算调性不够高雅的平台,只要从现在开始,提升自身形象,加强用户引导,情况也会逐渐好转起来。(文 /李金兰 斗鱼TV)