2020-12-21 15:49:51 阅读(163)
误解1:将某一类型的数据视为所有数据,导致分析结果错误 让我们从一个小故事开始:英国空军希望在第二次世界大战期间增加飞机的装甲厚度,但如果所有的装甲都增厚,它将降低灵活性,因此最终决定只增加攻击最大部分的装甲。后来,经过对中弹飞机的统计,工作人员发现大多数飞机都有更多的机翼弹孔,因此决定增加机翼的装甲厚度。直到后来一位专家说:“但是那些机头中弹的飞机还没有飞回来。” 这个故事应该分析所有的飞机,但统计样本不包括损坏的飞机,所以结论只是根据一些数据,或根据相同的特征(受伤),不能代表所有类型的数据,所以结果可能是错误的。 再举一个例子:不久前,为了分析人人网,我想看看人人网目前的用户访问情况,所以我选择了PV作为观测指标。通过alexa,人人网的PV在过去一年显著下降,这也证实了我的预期,因此我以此为论点进行了分析。但后来发现alexa只统计通过WEB的访问量,而用户移动终端的登录不在统计范围内!在过去的两年里,智能手机迅速普及,移动终端登录也非常普遍。这部分数据的缺失意味着上述统计数据基本上毫无意义,因为WEB终端访问量的下降可能是用户访问人人网络次数的下降,也可能是PC终端迁移到移动终端,因此该统计数据不能作为论据出现。 由此可见,我只统计了WEB端的访问情况,认为这是人人网的全部访问量,而忽略了移动端,从而导致了错误的结果。另一个问题是,因为我已经有了预期(人人网访问量下降),所以我正在为这个结论寻找相关的论点。当我找到符合我结论的论点时,很容易选择有利于我的数据而不做出更多的判断,这也是数据统计人员的一个常见问题。 用某种类型的数据代替所有的数据会误导我们做出错误的判断,统计时一定要注意这一点。一方面,我们需要意识到,在统计和分析数据时,我们应该始终考虑是否还有其他情况,是否有我们没有想到的数据类型。这些数据能否代表所有类型,并试图从更高的角度解释这些数据,而不是在获得数据后立即盲目分析。另一方面,它需要知识的积累。例如,如果你知道alexa是如何统计的,你很容易考虑移动终端的情况。知识的积累有助于我们做出准确的判断。这些知识和经验是从阅读或实践中获得的。平时多做,慢慢积累,时间长了自然会看得更全面。 误区二:明显的事件夸大了偶然因素 明显的事件更容易占据我们的视线,从而高估事件发生的概率。 例如,从年度统计中可以看出,近两年某基金的收益率达到100%,有某明星交易员等,人们会争相购买该基金,也会让人们认为购买该基金可以赚钱。事实上,很少有基金能全年保持这样的收益率。近两年收益前五的基金,五年后收益率很可能排名倒数第二,世界上大部分基金都无法跑赢市场。然而,人们仍然认为买基金真的很有利可图。当年XXX两年收益100%。两年收入达到100%只是偶然的,但由于事件过于鲜明,长期驻扎在人们的心中。 还有很多类似的事情。比如富士康的n连跳,大家都觉得这么多人跳楼,富士康肯定太黑了,但是大家都没有注意到富士康大概有37万员工。按照12连跳,自杀率不到14/4,而全国平均自杀率为15/10,000,n连跳自杀率远低于全国自杀率。可见,富士康的12连跳其实是一个社会问题,而不仅仅是一个企业问题。我们过于关注明确的事实,却忽略了背后的整体概率。 两天前,三人死于波士顿爆炸,微博祈祷,但阿富汗、伊拉克和其他国家几乎每天都面临这些问题,只是因为媒体不会整天报道新闻,每天攻击也麻痹人们的神经,所以我们只关注明显的波士顿爆炸,对其他地区每天发生的事情漠不关心。另外,比如你身边有人买股票赚了不少钱,也许你也会想投身股市试试运气,而忽略了散户8赔1平1赚的整体概率。另一个例子是,如果你周围有人买股票赚了很多钱,你也可能想投身于股市,而忽略了散户投资者的总体概率。你看到了各种成功企业家的报道,认为你也可以尝试创业,毕竟,成功的可能性似乎并不低。但你不知道那些不成功的人基本上没有机会被报道,事实上,创业成功的人可能不到1%。 说了这么多,其实太明显的意外事件会让我们忽略背后一直存在的整体概率。当你看到这些数据时,不要太情绪化。你看到的数据或事件可能只是一个例子,并不意味着大多数。你可以检查历史或平均情况,找到沉默的用户或数据,避免轻易做出判断和决定。理性对待这些事故,既不盲目跟随,也不嘲笑,在明确整体概率的情况下,消除事故因素,分析这些事故背后是否有一些值得借鉴的地方,从而吸收自己的产品或项目,使自己的产品或事情可能成为市场上的下一个“事故”。
以上就是关于关于数据分析的两大误区的相关介绍,更多关于数据分析的两大误区相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对关于数据分析的两大误区有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一