2020-11-24 09:49:05 阅读(762)
什么是内容审核?简单来说,审查用户在社交平台上上传、发布或共享的内容(文字、图片、音频、视频)。其主要目的是过滤和筛选低质量和粗俗的内容,从而生产高质量的内容,防止用户体验减少,保持良好的内容基调。在这个过程中,平台将有一个专业的内容标准作为参考。此时,一个大问题是手动筛选效率低,成本高。因此,许多内容平台采用算法进行过滤,通过人工与算法的有效结合来提高效率。过滤后的内容基本上可以保证无害,即使质量不高,也没有风险问题。此时,企业将面临先发后审还是先审后发的选择:“先发后审”:也就是说,用户先发布UGC内容,然后再审核;“先审后发”:也就是说,用户提交UGC内容后,只有在审核通过后才能在线发布。“先发后审”和“先审后发”的适用场景:“先发后审”:适用于对发布内容及时性要求较高的场景,如阅读、听歌曲等场景的用户评论。此时,用户发表的评论更为即兴创作。因此,从用户的角度来看,他们希望他们的评论能立即看到成功和有效。比如网易云音乐评论。“先审后发”:适用于在社区、论坛、新闻平台等场景下发表文章、意见、讨论等。此时,平台需要对内容负责,并建立权威,因此通常需要在审查后发表。例如:抖音,每个人都是产品经理。1、无论审核方法是什么,都应包括以下四个基本模块:机器审核、人工审核、用户投诉审核和结果审核。1.机器审核是根据制定的规则或机器学习算法来审核内容。一般来说,成熟的审核系统可以自动审核和处理95%甚至99%以上的内容。确定有问题的会自动删除,难以判断是否有问题会被标记,进入人工审核程序。2.虽然用户投诉审查和结果审查大多是人工审查,但这里提到的人工审查是指审查机器无法区分的内容,通常占平台内容数量的不超过5%.但对于一些大型内容平台来说,绝对数量已经很多了。在内容爆炸的时代,我们可以看到全国许多平台都有多个审计中心,每个审计中心都有成千上万的员工。3.用户投诉审查是前两者的补偿,以前没有出现过很多违规行为;因此,规则不能在规则可以过滤的范围内或非常隐蔽,难以严格过滤。用户投诉是发现新问题的重要渠道。通过知乎的危机事件,我们应该更加重视对投诉的审查,并及时补充机器的审查。4.结果审查通常采用抽查方法,如审查机器删除的内容,看规则或算法是否过于严格;例如,检查人工删除和通过的内容,看员工的工作是否按要求执行;例如,通过对内容的整体检查,看看是否没有注意到新的问题。2、审核流程的具体流程如下图所示:先通过机器审核,机器审核通过或不通过;如果机器审核不通过,则进行人工审核;如果机器审核通过,则进行人工抽样审核。三、这里审核的四个维度一般都是四个维度的审核,关键词审核,用户发布次数限制,重复内容过滤和白/黑名单用户。1.关键词审核词过滤链接,主要分为三类:1)只要禁止关键词匹配,内容就会自动删除或提交。通常只有少数词会被纳入禁止关键词,如清晰的色情、邪教和广告专属关键词。2)审核关键词这是最常见的关键词类型,只要匹配将自动进入背景审核,文章中的关键词将被突出和列出,帮助审核员快速判断。审核关键词也要尽量是专属关键词,防止太多内容被拦截到后台。3)在很多平台上替换关键词,我们会在文章中看到莫名其妙的号码或字母缩写*,这可能不是文章作者写的,而是系统自动替换的。这个关键词不想出现在平台上,但读者通常可以用其他代替读者来理解。例如,一些政治、宗教和不文明的语言可能会自动替换。当然,管理员在添加关键字时,往往不会直接将关键字添加到后台。否则,用户可以以非常简单的方式避免关键字过滤,比如在关键字中添加一个空间,系统很难匹配。因此,一般来说,后台将支持限定符{x}x是一个忽略的字节数,以限制相邻两个字符之间可以忽略的单词。在Discuz!网站后台有明确的说明,比如“a{1}s{2}s(不含引号)可以过滤“ass也可以过滤“”“也可以过滤”axsxs”和“axsxxs”等等。对于中文字符,如果使用GBK、Big-5.每个中文字符相当于2个字节;如果使用UTF-8版本,每个中文字符相当于3个字节。此外,关键词还可以支持正则表达式来匹配具有一定模式的关键词。比如”/1\d(10)d] |$/”(不包括引号)用于匹配手机号码。正则表达式内容太多,有兴趣可以搜索学习。2.用户发布次数的限制主要限制用户无限发送评论。在这种情况下,同一用户可以在一分钟内发送最多一条评论;每小时最多发送10条评论,每天最多发送30条评论。如果评论次数超过,则弹出“说话太累了,请休息”的提示。其实这个限制上线后,发现广告的人会不断注册新号来避免这个问题,以后可以考虑加。新用户需要注册多长时间才能发表评论,或者绑定手机号码才能发表评论。3.重复内容过滤通常用于广告。去除汉字以外的任何符号,如“抖音”、用“抖音”和“快手”对比“快abb手”;将评论与同一用户的上一条评论进行比较,如果10个以上汉字的重复率达到70%(20%,60%);30%,50%)toast弹出“请不要发布重复内容”;与此同时,评论仅与评论库最近发布的50条评论进行比较,如果20个以上汉字与其中一个重复率达到80%,机审失败(30%,70%);50,60%);在比较重复内容时,必须删除一些无关的符号。因为很多小广告喜欢加空格和逗号。因为很多小广告喜欢加空格和逗号。他们通常会备用几份文案来比较评论库;这也可以避免他们更改号码和文案的问题。4.白名单用户、黑名单用户、黑名单用户需要有一个可编辑的背景,可以随时增加或减少;如果同一用户在一天内失败超过10条评论,则自动列入黑名单。白名单的用户不受发布次数的限制,但内容需要检查广告词、敏感词和屏蔽词。如果一天内发布的评论超过10条,也将自动列入黑名单。用户在黑名单上发表评论时,弹出toast“您暂时无法发表评论”或机审直接失败。最后,IP没有限制,因为公共区域的WiFi似乎是IP。虽然我真的很想处理垃圾评论的问题,但我仍然希望在不影响普通用户的情况下。以上基本上是内容审核需要了解的一点。
以上就是关于何为内容审核?“先发后审”和“先审后发”的适用场景的相关介绍,更多何为内容审核?“先发后审”和“先审后发”的适用场景相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对何为内容审核?“先发后审”和“先审后发”的适用场景有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一