2020-11-19 10:07:57 阅读(163)
冷启动(coldstart)在整个推荐系统中,是一个重要的开始。推荐系统通常需要在大量数据的基础上进行更准确的推荐。APP的冷启动可能直接决定新用户是否会继续使用。新产品的冷启动也会影响生产者的热情,因此冷启动非常重要。冷启动问题分为三类:用户冷启动:新用户应该向他推荐什么?冷启动项目:新项目,应该推荐给谁?冷启动系统:在“一穷二白”的基础上,新用户和未推荐的物品,如何建立他们的联系?用户冷启动最常见的场景是新用户冷启动。将新用户转化为老用户的路径是获取新用户的兴趣(构建冷启动用户的初始肖像)->内容消费和兴趣收敛->沉淀兴趣成为老用户。综上所述,第一步是“千方百计”获取用户画像或让用户主动生成画像,有几种方法可以考虑。利用性别、年龄、地区等用户的社会属性。当用户第一次打开应用程序时,许多应用程序会提示或留下用户填写相关信息的入口。即使用户不主动输入,也可以尝试从外部渠道(渠道肖像、矩阵肖像、applist等)引入肖像信息(但需要注意用户的重叠度和相关性)。有了这些信息,粗粒度的个性化推荐可以根据社会属性进行。使用用户关系链,您可以通过运营活动收集(如支付宝活动收集朋友、亲子关系)或从外部引入(第三方登录或开放API),并根据“群体”的原则向用户推荐朋友喜欢的内容。在对用户“一无所知”的情况下,基于从众心理和28定律,可以尝试向用户推荐流行内容。这样主要关注流行的范围和算法,效果会比随机推荐好。使用高质量的内容也是如此。(左:微博,右:今日头条)用户冷启动的指标可以关注新用户的肖像指标(人均兴趣、肖像覆盖率、肖像准确性等)。)以及新用户的活跃性能(点击率、保留率等。).假设一款基于国籍和性别的国际APP一开始可以有更好的推荐效果。它如何获取这些信息?显性方法:正如前面所说,用户可以填写、指导或激励用户。隐性方法:用一些性别/国籍点击差异很大的内容来猜测用户的性别和国籍,然后开始有偏见的个性化推荐。这种隐藏的探索,选择项目需要技能:流行:有一定的认知,项目太罕见,大部分结果必须是“跳过”。具有代表性和区别性:物品与物品之间要有区别,能够表达用户的不同兴趣。多样性:由于人们的兴趣多样,要注意尽可能多的覆盖,避免“无选择”的尴尬。项目冷启动思路利用项目内容推荐:项目类似推荐:找到与新项目相同的内容,新项目搭上“搭便车”,进行类似推荐。项目相关推荐:根据专家知识建立项目信息知识库,建立项目之间的相关性。例如,知识图谱,通过一个已知的节点和关系找到另一个节点进行扩展推荐。例如,一个用户喜欢“周冬雨”(节点)。周冬雨是电影《青春的你》的主角。通过这种关系,它与节点“青春的你”有关,因此向用户推荐“青春的你”。(图片来自网络)相关算法简介中常用的算法有哪些?假设A用户是新用户,只有少量肖像。UserCF:根据用户的协同过滤,通过用户行为计算用户的相似性,找到与A用户相似的B用户,并向A用户推荐B用户喜欢的物品。ItemCF:根据物品的协同过滤,通过用户行为计算物品的相似性,找到与物品a相似的物品B,并向喜欢物品a的用户A推荐物品B。 (左:UserCF,右:ItemCF)ContentItemKNN:基于内容的过滤,根据项目的内容特征计算内容的相似性,找到类似项目A的项目B,并向喜欢项目A的用户A推荐项目B。UserCF和ItemCF使用相同的用户行为数据,但统计维度不同。UserCF和ItemCF使用相同的用户行为数据,但统计维度不同。如下图所示,UserCF横向计算用户的相似性,ItemCF纵向计算用户的相似性。UserCF、在冷启动问题上,ItemCF存在“第一驱动力”问题。UserCF,为了让新项目首先出现在用户显示列表中,更多的人可以反馈项目,项目可以传播,所以有一个第一个驱动力问题,即第一个用户在哪里找到新项目。ItemCF是计算用户行为(巨大的日志,更耗时)计算项目相似性(如果大量用户看到项目A,也看到项目B,即认为两个项目相似),输出项目相关矩阵,新项目不会自动添加矩阵表,也需要用户首先找到新项目。ContentitemKNN利用物品的内容特征计算物品相关表,可以频繁更新相关表,没有第一驱动力问题。然而,它忽略了用户行为,从而忽略了用户行为中包含的规律。结果精度低,新颖性高,效果一般不如协同过滤。但是,如果用户的行为受到内容特征的强烈影响,内容过滤算法就有亮点。上述第一驱动力问题,即物品冷启动问题,又称“新物品试投”,有什么解决办法?新品试投是“物品寻找用户”。若为“用户寻找物品”,则容易出现马太效应:热门分类曝光多,长尾现象严重。有两种方法可以找到用户:随机投资兴趣投资假设我们定义曝光不到500个项目是新项目(信息产品一般有时间限制,如6小时内),新项目和用户表示多维向量,计算向量距离,更活跃的用户分发,在冷启动阶段排序加权和重排限制。在冷启动阶段,物品会有稳定的点击率(或其他综合指标),这是其后续流量分配的基础——根据小流量的点击率性能,性能好的物品会进入下一个更大的流量池,性能差的物品会被淘汰或减少。梯度流量分配策略是一种常见的个性化推荐“赛马机制”。用什么指标来评估冷启动效果?此外,还需要注意用户的上下文信息,包括时间信息和空间信息,并遵循一些强有力的规则。例如,电子商务应用程序,新用户在夏季登录时不应推出羽绒服;如果你在中秋节登录,你不应该推出端午节的信息。但这不仅在冷启动阶段,在整个推荐场景中也要注意用户的上下文信息。备注:参考文献《推荐系统实践》项亮编辑
以上就是关于冷启动问题详解:用户冷启动、物品冷启动、系统冷启动的相关介绍,更多冷启动问题详解:用户冷启动、物品冷启动、系统冷启动相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对冷启动问题详解:用户冷启动、物品冷启动、系统冷启动有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一