关键词过滤存在的问题也很明显,准确率较低,经常出现误伤和漏网的情况,对于内容和社区平台来说,这是不能容忍的,前文已经讲过,哪怕一篇违规内容被放出来,产品都有可能被封禁。
再加上网络的普及,越来越多的人学会了通过拼音、乱码、谐音等方式绕开关键词,关键词过滤逐渐不再能胜任内容风控的工作任务。
以上基本还属于规则的范畴,之后内容风控的发展,就进入了AI 策略的时代。
AI方面,其实叫机器学习更加准确,这是一套组合拳。举个例子,对于一个视频稿件的审核,就需要对整个视频进行逐一拆帧,然后通过OCR文字识别检查字幕,此时对于字幕的检查和文字内容的检查基本一致,文字识别涉及到NLP分词、语义理解等AI技术;
对于画面,则是图片识别,识别图片中可能出现的违禁内容,这里涉及到一个准确率的问题,暴恐视频不能够通过,但游戏视频也存在战斗画面,如何保证不误伤;对于音频,则需要两个方面的审查,一方面是视频当中的语句,将语音转文本,再通过文字的审核策略来审核,另一方面是音调识别,例如识别音频当中的娇喘等无语句的声音。
机器学习还是就稿件论稿件,而一个优秀的内容风控平台,是需要配合策略的。策略产品经理是近几年一个特别火的岗位,提供更精细化的、动态的、效率的产品解决方案。对于策略来说,内容的风控不能只在单个内容上,还需要结合更高的维度,给与更加精细化的识别判断。
策略要从单个内容出发,延伸到发布该内容的用户基础信息、关系链、过往内容、实名可信度等等诸多维度进行调参和计算,以判断这名用户的这条内容是否需要更细致的识别。
这里要特别强调一点,即使平台的机器算法再先进,所有的内容还都需要过人审核。所有内容过人,所有内容过人,所有内容过人,重要的事情说三遍,至于原因,还是上面那一条,内容和社区平台不容有半点闪失。
不过机器平台越先进,能够为人工审核提供的辅助也就越全面准确,人工审核的效率自然也就变高,审核人员的压力也相应减弱。
另外,对于内容风控,又会有前置风控(先审后发)和后置风控(先发后审)等不同的方式,关于这一点,以后有机会再详细分析优劣和适用场景。
对于B站来说,随着内容量越来越大,单纯的对审核人工进行扩容,恐难以解决问题。相比抖音、今日头条、西瓜视频等头条系产品、背靠百度AI的爱奇艺、腾讯视频、阿里大文娱旗下的优酷视频,B站崛起晚、资源少、技术储备弱,在机器辅助审核上还比较弱势,今后加强内容风控技术,优化内容审核策略,改善审核后台的体验,不失为一个好方法,毕竟工欲善其事,必先利其器。
作者:亨哼,一个正经的互联网产品人,公众号:亨哼阵地(ID:hengpaper)
本文由 @亨哼 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自pexels,基于CC0协议