【导语】知乎将算法大规模应用于社区氛围的管理,全力减少低质和无关内容对读者的干扰,降低网络暴力,为用户提供人文关怀。
知乎正从一个服务于一部分人的知识社区,迈向一个普惠的内容平台。面对海量内容,算法推荐成为保障知乎这座“超级城市”文明有序的必经之路。
全行业几乎都在应用算法研究用户喜好,拼命推荐内容,而知乎却将算法大规模应用于社区氛围的管理。在管理社区氛围的算法机制方面,知乎通过算法机器人“瓦力”实时高效处理多个场景,如答非所问、歧视、恶意贴标签、辱骂等各种不友善行为,以全力减少低质和无关内容对读者的干扰,降低网络暴力,为用户提供人文关怀。目前,“瓦力”的准确率在部分场景中最高能达到。后续,知乎会在保证准确率的基础上,不断提升“瓦力”的覆盖范围。
此外,知乎还尝试在语义分析的基础上,进行情感分析的前沿探索。知乎通过对庞大且高质量用户行为数据的分析、学习,对语义和用户关系这两方面进行更深层次的理解和建模,从而有机会突破“识别反讽”这个一直困扰情感分析领域的前沿话题。这将对中文互联网乃至世界互联网的讨论环境产生促进作用。
但算法只是一种工具,可以运用但不能过度依赖。在应用AI上,知乎有两大优势。首先,知乎积累了非常好的中文语料库。知乎上不仅有大量优质问题和回答文本,同时,用户在知乎上的行为也是非常重要的数据。用户在生产和消费内容的同时,还会一同参与社区建设。比如,用户对回答的赞同和反对,对内容的举报,对问题和话题进行公共编辑等。通过这些有监督的语料,知乎对于语言的理解可以达到一个更高的层次。此外,知乎还积累了非常丰富的社区管理经验。在摸索社区规范的过程中深刻理解了不同用户的不同诉求,让社区规范适配复杂多样的场景。这些经验亦为知乎使用AI算法来进行氛围治理打下了坚实的基础。
为预防算法风险, 知乎的理想算法是母爱算法和父爱算法的结合。所谓父爱算法,就是不断地通过优质的内容引导用户去探索他的兴趣边界,发现更大的世界,让用户既能获得感兴趣的内容也能获得有帮助的内容。这对于知乎和知乎的用户来说尤其重要,这就是我们的核心使命。因此我们在父爱算法上花的精力尤其多,其中包括对优质内容的识别、对推荐算法召回排序方式的优化,以及运营同事对于分发的干预。整体来说,知乎采用的算法会将更多参数作为推荐内容的依据,用优质的内容引导用户去探索兴趣边界,发现更大的世界。(李大海:知乎合伙人、高级副总裁)