2020-11-20 15:51:30 阅读(176)
基于敏感词的风险控制策略是所有风险控制系统中最基本的,内容简单但琐碎。该系统涉及从用户发布到用户报告、命中策略到审计处理、用户肖像到人工智能识别等方面。本次系统整理总结了敏感词操作系统建设以来的经验和想法。作为自我总结和回顾,我也希望分享,避免其他学生在敏感词操作中少走弯路。一、产品概述1.1 敏感词系统是搜索和内容产品的基本风险控制系统。本文从词库匹配出发,全面介绍了敏感词系统构建的结构和过程,包括敏感词添加、命中方式、影响业务和用户。1.2产品功能概述可以通过本系统过滤基本的文本敏感内容;敏感词过滤方法可以结合业务线灵活掌握,用户可以触摸敏感词。1.3名词介绍词库:由同一类敏感词组成的一大类。本文有四个词库(红线词库、敏感词库、危险词库),每个词库都有三级分类。单词过滤:对于搜索业务,直接过滤搜索单词。结果过滤:直接过滤命中敏感词的结果。二、使用场景敏感词系统最基本的功能有匹配词库就够了,但面对越来越复杂的产品形式,单个敏感词系统使用场景的问题基本上有以下四类:场景一:A产品要小规模内测上线,产品中的评论功能需要接入最基本的敏感词来控制风险。然而,面对操作词库,我们找不到属于“基本”敏感词;场景2:B产品被用户反馈为粗俗的色情内容,但明显添加了敏感词。经检查,发现敏感词只控制A业务,新的B业务被用户投诉而不增加控制;场景3:C产品被老板反馈,他们发表的评论消失了。发现它击中了敏感词,导致操作找到,但操作认为这个词字面上有问题,没有添加依据;场景4:及时掌握大量敏感词,但仍依靠人工调查扩大词库,耗时费力;因此,系统将尝试解决上述四个问题。3.产品需求1.核心路径用户:输入/发布–>敏感词检测–>过滤–>结果显示:操作:发现敏感词–>评估–>添加–>处理过滤内容。2.模块结构3。功能树系统以词库为基础,根据不同的重要性区分不同的类别,如红线类别、敏感类别、危险类别等。不同的类别结合不同的匹配方法,如用户维度和区域维度、正则匹配或精确匹配,作用于不同的业务,产生不同的效果。2.模块结构3。功能树系统以词库为基础,根据不同的重要性区分不同的类别,如红线类别、敏感类别、危险类别等。不同的类别结合不同的匹配方法,如用户维度和区域维度、正则匹配或精确匹配,作用于不同的业务,产生不同的效果。4.页面结构5。原型设计5.1战略配置背景功能:词库与业务的结合。控制影响模式(单词过滤或结果过滤),控制持续时间,控制状态(有效或离线),掌握战略召回的数量,并处理战略召回的内容。页面描述:战略管理页面可直接配置控制策略。例如,在红线词库中,将二级类别添加为“低俗色情”,并选择该类别下的所有三级类别“all“,选择需要控制的业务,如一级业务“搜索”,所有二级业务,选择影响模式和持续时间,效果如下:“搜索下的所有业务都受到红线词库-粗俗色情类敏感词的影响,影响模式在搜索词时受到影响,是永久影响状态”。在业务控制和词库管理中进行战略配置所需的其他部件的添加或修改。原型演示:5.2词库管理背景功能:添加敏感词,控制词所属词库,添加时可看到召回量,抽样评估后可获得拦截精度。页面描述:敏感词可以直接批量添加多个单词,初步判断单词库的字面意义,然后评估召回量和随机样本,给出是否需要生效,并确认单词库。在“样本设置”中可以进行随机样本提取的数量和方法,在“敏感词评估”中可以进行命中精度评估。原型演示:5.3用户配置背景功能:将用户与敏感词、业务、区域三个维度相结合。页面描述:敏感命中策略是指“策略配置”页面的策略。您可以看到被该策略召回的用户数量。单击“处理”跳转到“内容处理”页面进行处理。原型演示:5.4内容处理背景功能:处理命中策略的业务或用户。页面描述:时间是指策略生效的时间,可以在页面上处理增量和库存内容。原型演示:5.5数据统计背景功能:从战略维度、词库维度、用户维度和处理维度进行数据统计。页面描述:报表形式给出原型演示:四、未来规划互联网前人人平等,因此人们可以很容易地暴露自己黑暗的一面。敏感词系统应运而生,以避免其他用户看到、接触和受到这些黑暗信息的影响。这不仅具有过滤产品基本风险的功能,而且作为基本系统,为公众提供清晰的网络环境,因此敏感词系统也需要不断优化和改进:利用人工智能技术增强语义识别功能,扩大添加渠道,及时发现和处理;敏感词系统和舆论系统已成为负面舆论控制和处理的有力工具。
以上就是关于敏感词运营系统的搭建应该如何做好呢?的相关介绍,更多敏感词运营系统的搭建应该如何做好呢?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对敏感词运营系统的搭建应该如何做好呢?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一