2020-12-18 14:24:01 阅读(580)
针对微博API的限制,研究人员主要跟踪敏感用户群,最有可能发送敏感帖子。从2012年7月20日到9月8日,研究人员每分钟搜索3500名用户的时间线,每四秒搜索一次公共时间线。由于新浪微博不支持匿名查询,他们在使用Tor隐藏IP后创建虚假用户账号。他们收集了238万用户的时间线帖子,删贴率为12.75%。考虑到新浪需要处理的大数据集规模,发布后5-10分钟的删除峰值,特别是新浪如何快速发现和删除敏感帖子,因为删除帖子不能完全自动处理?研究人员提出了六个假设:1。新浪微博有一个监控关键词列表,审查员会浏览包含这些关键词的帖子,决定是否删除。2.微博有针对性地监控频繁发送敏感帖子的用户。3.发现敏感帖子后,审查员可以追溯所有相关转发帖子,并可以一次性删除。4.通过关键词搜索,微博删除了可追溯性帖子,导致特定关键词在短时间内删除峰值。5.审查员的工作是分布式的,相对独立,有些人可能是兼职的。6.删贴速度与主题有关,删贴速度因主题敏感度而异。研究人员利用自然语言处理技术对删除主题进行了分析,发现一些流行的主题帖子比其他主题更快地被删除(如图所示),如群体交通、北京暴雨死亡人数和司法独立。研究人员总结了微博的过滤机制,其中主动过滤机制包括:显式过滤、微博通知帖子内容违反内容政策(但有时用户不知道什么敏感词受阻);隐式过滤,微博需要手动审查帖子才能允许帖子上线;伪装成功,其他用户看不到用户的帖子。
以上就是关于新浪微博的删帖机制揭秘的相关介绍,更多新浪微博的删帖机制揭秘相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对新浪微博的删帖机制揭秘有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一