2021-01-05 16:36:36 阅读(142)
1.数据探索(1)购买一次的用户比例为74%,购买二次的用户比例为16%,只有约10%的用户支付三次以上。从图中可以看出,支付一次用户的支付金额约为47%,支付二次用户的支付金额约为23%,支付两次以上用户的支付金额约为30%(其中三次支付占12%)。(2)道具分析(TOP15)可以看出,60颗钻石、双倍杨桃、3000杨桃在所有道具购买中所占比例最大,分别为:24.41%、17.63%、16.70%(合计:58.74%)。可以看出,购买60颗钻石、双倍杨桃和3000颗杨桃的人数在所有道具中所占比例最大,分别为:29.72%、26.38%、22.55%(合计:78.65%)。可以看出,道具中双杨桃的收入比例最大(28.75%),其次是60颗钻石(11.93%),3000杨桃、刀刃、VIP等。2、从以上数据可以看出,用户的支付习惯具有以下特点:(1)用户一次购买比例最大,二次购买。(2)购买一次的用户对收入贡献最大,也是产品收入的中间力量。(3)从购买道具的角度来看:60钻石、双杨桃、3000杨桃是最受欢迎的道具,购买人数和次数最多。(4)从购买金额来看:双杨桃的购买金额最大,远高于其他道具的购买金额,但60颗钻石、双杨桃和3000颗杨桃的购买数量最多。由此可见,道具的价格差距是显而易见的。总之:为了增加收入,可以想办法让购买一次的用户再次消费,降低一次消费者的比例,增加二次消费者的比例。提供用户的付费次数可以进一步提高付费用户对游戏的忠诚度,从而提供付费用户的活动,降低付费用户的损失率(损失成本过高)。利用道具之间的相关性,我们可以向购买道具A的用户推荐购买率最高的道具B,从道具的角度出发,粒度相对较细。3、道具相关性分析概述:通过数据挖掘的相关性分析方法,我们可以知道道具之间的相关性(每个规则都有相应的概率大小),但最终规则不一定具有真正的意义和价值。规则的合理性需要业务侧的筛选和判断。每个规则都有相应的概率来支持。概率越大,规则的真实性越可靠。原理(可以不看,举例作为理解):关联分析是在大规模数据集中寻找有趣关系的任务。这种关系有两种形式:1。频繁收集(frequencyitemsets):一些元素的集合经常同时出现。2.关联规则(associationrules):这意味着两个(或多个)元素之间有很强的关系。以下是上述两个概念的例子:表1来自HoleFods天空食品店的简单交易清单交易号码商品0豆奶、生菜1生菜、尿布、葡萄酒、甜菜2生菜、尿布、葡萄酒、橙汁3生菜、豆奶、尿布、葡萄酒4生菜、豆奶、尿布、橙汁频繁收集是指经常出现在一起的元素收集,上表{葡萄酒、尿布、豆奶}是频繁项集的一个例子。也可以像“尿布”一样找到–>“葡萄酒”的相关规则意味着如果有人买尿布,他们很可能也会买葡萄酒。也可以像“尿布”一样找到–>“葡萄酒”的相关规则意味着,如果有人买尿布,他们也可能买葡萄酒。通过使用频繁的项目集和相关规则,企业可以更好地了解客户的消费行为,因此大多数相关规则分析例子来自零售业。要回答上述问题,最重要的是理解两个概念:支持和可信度。支持:项集的支持(support)该集的记录占总记录的比例。从表1可以看出,项集{豆奶}的支持度为:4/5;在5个交易记录中,3个包括{豆奶和尿布},因此{豆奶和尿布}的支持度为3/5。可信度或可信度(confidence):它是针对{尿布}等一个–>定义了{葡萄酒}的相关规则,该规则的可信度定义为:“支持({尿布,葡萄酒}/支持({尿布})”。表1中可以发现{尿布,葡萄酒}的支持度是:3/5,{尿布}的支持度是:4/5,所以相关规则是“尿布”–>葡萄酒的可信度为:3/4=0.75,这意味着该相关规则适用于所有包含“尿布”的记录中75%。表1中可以发现{尿布,葡萄酒}的支持度是:3/5,{尿布}的支持度是:4/5,所以相关规则是“尿布”–>葡萄酒的可信度为:3/4=0.75,这意味着相关规则适用于所有包含“尿布”的记录中75%的记录。算法应用:环境:linux python。参数:支持(minSupport)、置信度(minConf)。参数说明:minSupport、minconf参数的大小与最终相关规则的结果数量有关。参数值越大,规则越严格。由于上述用户购买次数可以看出,一次购买的用户占70%以上。也就是说,超过70%的用户只购买道具。在这种情况下:支持(minSupport)值不可能很大(低于10%),如果太大,最终不会有频繁的项集,然后就不会有最终的相关规则。因此,我们可以让支持(minSupport)更小的值,让置信度(minConf)为了获得最终的相关规则,价值更大。因此,我们可以让支持(minSupport)更小的值,让置信度(minConf)为了获得最终的相关规则,价值较大。(1)minSupport=0.05,minConf=0.2。规则(购买道具A会购买道具B)概率(可信度)VIP—–>双杨桃0.5108837522说明:这里的支持度是5%,信誉度是20%。最后,一条规则是用户购买VIP后购买双杨桃的可能性。然后我们调小minSupport的值得到以下结果。(2)minSupport=0.01,minConf=0.2。规则概率(置信度)125钻石—->60钻石0.7085430377—–>双倍杨桃0.51008372300钻石—–>0.429424709211节日礼包—->0.34025758205神秘礼包—->刀刃0.334025758205300钻石—–>125钻石0.295504558315125钻石—–>300钻石0.2974683544312000杨桃—>刀刃0.290452499408300钻石—->刀刃0.230430682175300钻石—–>125钻石,60钻石0.2463727—–>300钻石,60钻石0.248101265823结果可见最终相关规则数量较多,概率的大小也不同,但VIP—–>双杨桃这一规则一直存在。结论:根据数据挖掘的相关规则,我们可以获得一些购买道具的相关规则。我们可以根据最终规则推广活动,从而降低一次性付费用户的比例,增加二次或多次付费的比例,进一步增加收入。结论:根据数据挖掘的相关规则,我们可以获得一些购买道具的相关规则。我们可以根据最终规则推广活动,从而降低一次性付费用户的比例,提高二次或多次付费的比例,进一步提高收入。这里我们研究的是自然周数据,我们也可以研究自然月数据。
以上就是关于关联分析在游戏行业中应用案例的相关介绍,更多关联分析在游戏行业中应用案例相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对关联分析在游戏行业中应用案例有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一