2021-01-05 09:51:36 阅读(418)
本文总结了微信微信官方账号《大数据分析的道与术》:PMCraft1.因果关系错误,夏季冰淇淋销量越好,游泳溺水事件越多。冰淇淋中某些成分对人有影响吗?经过简单的思考,你会发现冰淇淋的销量越高,温度越高,孩子们在河里游泳越多,溺水事件就越多。冰淇淋的销量与溺水有关,而不是因果关系。上面的例子很简单,也很容易识别,但在实际的数据分析中,关联和因果并不那么容易区分。再举一个例子:一家广告公司的分析人员发现,用户的月广告投资越高,流失的可能性就越小,而广告投资较低的用户群体就越容易流失,从而得出结论:“高投资会降低客户流失率,建议销售引导客户在第一个月增加广告投资,从而降低新客户流失率”。实际情况是,新客户的初始投资往往相对较少。看到广告的效果后,他们会逐渐扩大广告预算。高投资的客户流失率很低,因为他们认识到广告的效果,而不是因为他们花了更多的钱。关联性很容易判断。如何判断是否是因果关系?因果符合以下特点:1。两个事件是相关的,也就是说总是同时发生。2.原因在前面,结果在后面。3.如果原因被消除,需要设计相对严格的对比来证明结果也被消除。更多的时候需要靠经验来判断。这个时候要多注意慎重结论。2.不匹配比例:美西战争爆发后,很多美国人不愿意参军,坦诚是因为怕死。针对这种情况,美军做了一份统计报告,说服大家参军:“据可靠统计,美国海军死亡率为0.9%,而同期纽约市民死亡率为1.6%”,潜台词非常明显。如果你害怕死亡,你应该参军,因为在军营里比呆在纽约更安全。乍一看,这个例子看起来很有道理。如果你仔细思考,你会发现阴谋:比较对象不同!如果你仔细看,你会发现美国海军的死亡名单基本上是健康的年轻人,而纽约公民的死亡名单大多是老年人、弱者、病人和残疾人。这两个数据显然不适合放在一起。在进行数据比较时,需要选择合适的比较对象,以便更准确地识别和发现结论。在数据分析中,一般选择的比较对象如下:与去年同期或上个季度等历史同期相比。与之前的产品开发预期相比,同行竞争产品的合理预期,如A产品的研发,比预期收入增加10%。同质对照组A/BTest结果的比较3。根据个案的认知,每当说服朋友戒烟时,朋友总会拿出这个笑话:63岁时不抽烟不喝酒–73岁的林彪不抽烟只喝酒。–83岁的周恩来只抽烟不喝酒。–毛泽东抽烟喝酒,93岁–邓小平吃喝嫖赌,103岁–张学良没有坏习惯,一生做好事–23岁时,无论雷锋是否吸烟,一个人都可能在不同的年龄死亡。根据宏观统计,吸烟者的平均寿命比不吸烟者小5岁,上述案例无法解释问题4。精心挑选的数据维度例:在一所艺术学院,男孩的校服只有裤子风格,女孩有两种款式:裤子和裙子。据统计,75%的女孩选择裙子,25%的女孩选择裤子。今天,当你进入校园时,你可以从远处看到一个穿裤子的学生。他是男孩还是女孩的概率更高?感觉答案是男生概率高,因为所有男生都穿裤子款式,只有25%的女生选择裤子款式。答案是男孩的概率很高,因为所有的男孩都穿裤子,只有25%的女孩选择裤子。这个例子忽略了一个重要的数据:男孩和女孩的数量。如果我告诉你,学校有1000人,900人是女孩,100人是男孩,结果是什么?900*25%=225%的女孩选择裤子。显然,100人选择男孩的裤子。在这种情况下,这个人更容易成为女性。在普通人眼里,经常会有男女各占一半的经验误解。因此,在某些情况下,隐藏一些数据就是撒谎。5.一个冬夜,产品流量下降,经过一些分析,原因:天气太冷,网民不愿意上网,因为手冷,提前上床睡觉,所以流量下降。一个冬夜,产品流量上升,经过一些分析,原因:天气太冷,网民愿意出去,不得不在家上网,所以流量上升。案例背后的信息是:结果可能有很多原因可以解释,“大欺骗”经常引导人们只相信其中一个,整个推理过程没有相应的细节和数据辅助。6.先入为主的偏见不要往下看。这张图的内容是什么?你可能会觉得这张照片太模糊和抽象了,你暂时看不到它是什么。如果你告诉你这是一只斑点狗,很多人会突然意识到它确实是一只斑点狗。这里隐藏着一个重要的心理概念:你会发现你在想什么,你会得到你期望的结果——勃朗宁的概念有一个流行的说法是“人们只会看到他们想看到的东西”。在数据分析中,虽然很难没有任何“先入为主”的观点,但我们仍然需要追求客观分析的态度,并根据数据及时观察和反思,不断纠正自己的观点。
以上就是关于数据分析中,如何判断是否是因果关系?的相关介绍,更多数据分析中,如何判断是否是因果关系?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据分析中,如何判断是否是因果关系?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一