2020-12-01 14:52:47 阅读(149)
1.从用户模型维度的划分可以看出,属性和兴趣维度的用户模型可以归类为用户肖像(UserProfile)的范畴。所谓用户肖像,简单来说就是标注用户信息。如图1所示。一方面,标签结构化用户信息,便于计算机识别和处理;另一方面,标签本身也具有准确性和非二义性,也有利于人工分类、分析和统计。用户信息标签用户属性是指性别、年龄范围、地区、教育程度、学校、公司等相对静态和稳定的人口属性。这些信息的收集和建立主要依赖于产品本身的指导、调查、第三方提供等。微博本身拥有相对完整的用户注册指导、用户信息改进任务、认证用户审计和大量的合作伙伴。在收集和清理用户属性的过程中,主要需要注意标签的标准化和不同来源信息的交叉验证。用户兴趣是一个更动态、更容易改变的特征。首先,兴趣受到人群、环境、热点事件、行业等方面的影响。一旦这些因素发生变化,用户的兴趣就很容易迁移;其次,用户的行为(特别是互联网上的行为)是多样化和分散的,不同的行为反映了不同的兴趣。接下来主要介绍微博画像中兴趣维度的构建方法。2.微博用户兴趣分析(1)标签来源用户的标签、人才或认证标签、公司、学校、微群标签、星座、微博关键词...这些来源可能成为用户的标签。除了每个特定的用户收集标签本身,他关注用户的标签也会传递给用户。如图2所示(蓝色实线代表关注,橙色虚线代表兴趣标签来源)。在收集用户可能存在的标签后,用户兴趣标签来源(2)权重计算还需要赋予标签一定的权重来区分不同标签对用户的重要性。考虑用户质量、标签传输路径、转发关系、标签本身以及标签与用户之间的共存关系。不同质量的用户产生不同的标签权重。质量越高,标签的可信度就越高。无论是给自己还是传递标签,其权重值都越高。标签传递路径主要针对基于关注关系的标签传递,亲密度较高的关注用户传递的标签权重值较高。标签是来自用户的原创还是转发的微博,权重值会有所不同。一般来说,原始权重会高于转发权重。如果标签本身是一个非常常见的词,那么用来描述用户兴趣的区别就相对较差。相反,如果它是一个长尾词,它就有很强的区别。考虑到这一点,长尾词越多,标签的权重值就越高。标签与用户的共存关系是指用户与标签是否经常共同出现,并评估两者之间的相关性。相关性越高,标签的权重值就越高。基于上述因素,一个标签对特定用户的权重值大致可以表示为:标签权重=(来源因素 亲密度因子 转发因子 长尾因子)×共现因子。(3)随着时间的变化,用户的兴趣会转移。时间越长,标签的权重就会相应降低,离当前时间越近的兴趣标签就会得到适当的突出。考虑到这一点,通常会在标签权重值上叠加一个时间衰减函数,设计成指数衰减的形式,通过定义衰减幅度和半衰减期来调整衰减程度,反映不同的及时性。此外,还将为用户的兴趣设置一个较小的时间窗口,以获得用户的短期兴趣。收集兴趣标签,通过用户在短时间内的原创、转发和关注行为来计算标签的权重。短期兴趣更新周期会比长期兴趣更短,兴趣更集中,但能及时反映用户兴趣的变化。(4)从兴趣到能力,但用户的兴趣只意味着他愿意接受这些信息,而不意味着他有能力生成相关内容。因此,在挖掘用户兴趣标签的基础上,还需要探索哪些用户对特定标签有一定的内容制作能力。微博关注关系可以认为是一种认证,相同兴趣的用户之间的关注可能是相同的兴趣(当然,也可能不是,但毕竟,有一定的指导),然后提出相同兴趣标签的用户,通过关注关系形成图片,认证最多的用户(关注最多)被认为是最强大的兴趣标签。如图4所示,用户带有红色边框。3.总结用户肖像的目的是标记用户信息,介绍微博用户肖像的特点,用户肖像主要从微博业务开始,改善用户信息,探索用户兴趣,区分兴趣和能力,形式化结构化表达。数据来源也主要是微博平台本身,没有使用更多的边缘数据。
以上就是关于微博画像中兴趣维度的构建方法的相关介绍,更多微博画像中兴趣维度的构建方法相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对微博画像中兴趣维度的构建方法有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一