数据分析五步法，这个框架具有几方面特点

2020-11-24 09:47:21 阅读（242） 评论（0）

我们将介绍一种通用的数据分析方法：数据分析五步法，该框架具有以下特点：不与特定业务绑定，从决策所需的信息开始；开放，可融入个人经验和前沿技术；结合大数据技术，消除人工链接，实现自动化；逻辑清晰，易于学习。一、简单的数据分析五步法分析五步法，基本上可以应对日常工作中至少80%的常见数据分析问题。剩下的20%的场景可以在这个基本的分析方法论中扩展，我们将在以下内容中讨论。1.15个基本步骤首先，我们一次解释了5个基本步骤，即总结细分评价归因决策1.1.总结这一步，我们*的是指标，也就是大家常见的DNU。、DAU、GMV、ROI等等。说到数据分析的内容，肯定会提示数据分析“明确目标”。因此，我们不需要重复这一重要性。在所有指标中，目标当然是最重要的。但是只有目标是不够的，我们还需要其他辅助指标。例如，ROI计算投入和产出；GMV也可以乘以平均每个用户的GMV来计算。通过这种方式，我们将目标的计算分为更多相关指标的组合。而且，这些指标更基本，我们可以通过一些操作手段来影响这些指标的变化趋势。理解这一部分并不难。然而，我们需要找出指标之间的计算关系，从而逐渐找到我们需要关心的所有指标。在当前的互联网产品运营中，从不缺少需要看的指标，已经到了眼花缭乱的地步。但只有那些与目标相关的指标，我们才需要*。1.1.这一步的细分相当于给指标增加了一个或几个维度。时间应该是最简单的维度。例如，我们每天都在看紫外线的变化趋势；或者，我们看看不同页面带来的GMV是多少，不同用户群体中的GMV是多少等等。如果我们理解之前的指标只是一个数字，那么在增加维度后，它就变成了一列数据；在增加了两个维度后，它变成了一个表格，等等。就像指标的现状一样，我们也可以很容易地找到许多维度可以用来分割指标。例如，上述日期和人群，以及新的来源渠道、活跃的流量来源和转换路径等。通过对这些维度进行排列和组合，可以产生大量复杂的拆分维度，多到根本看不见。因此，细分前的关键环节是区分维度的重要性。如何区分？我们应该根据是否可操作来区分这些拆分维度的优先级。比如前面提到的GMV是看APP中不同页面带来的。但是，如果我们没有必要的技术手段或操作工具来为GMV较高的页面分配更多的流量，也不能减少GMV较低的页面流量，那么我们就没有任何操作空间，更不用说操作后的优化空间了。在这种情况下，我们应该认为来源页面的维度只是一个“看”的维度，而不是一个关键的维度。另一个例子是用户分组，特别是当我们想从外部排水中获得更多高质量的新用户来推动增长时。此时，我们总是希望首先对现有的高质量用户进行用户肖像，确定一些能够识别高质量用户的特征，然后通过这些特征筛选出高质量的用户。这个道理是有道理的，但不幸的是，外商投资渠道不能提供非常准确的人群定位，只能提供粗粒度的划分，如人口统计和内容偏好。这也意味着我们暂时认为交付渠道对用户的标记非常准确，没有考虑标记错误的可能性。所以可以看出，在拉新这件事上，我们对用户分组的操作是有限的——不是完全不可能的，而是非常有限的。用户分组更大的利用空间是促进活动，即在我们自己的用户群中进行分割。例如，在增长案例中，将不同的文案或图片材料放置在同一页面的同一位置，以便在版本之间进行A/BTest，所以具体显示哪个版本是一个可以自由操作的维度，因为一旦发现哪个版本更好，我们可以迅速采取行动，取代其他糟糕的版本。因此，显示版本的维度非常适合划分指标。假如说[摘要]的部分只是一个监控，那么在[细分]的步骤中，已经反映出一些分析的感觉。在这一步中，我们需要找到真正可操作的拆分维度，以便我们的分析结论能够尽快落地。但这部分还有一个问题，就是如果有多个可操作的拆分维度，那么它们之间应该有区别。例如，我们可以简单地替换图表和文案，但我们也可以煞费苦心地迭代产品的大版本。该操作的复杂性如何在分析过程中得到体现和衡量？这就是关于[评价]的问题。1.1.在[评估]步骤中，我们应该使用[总结]步骤中的指标作为目标，并将其作为评估的唯一标准。如果我们的目标是简单的GMV，甚至是更简单的PV和UV，那么在[细分]步骤之后，我们基本上可以开始得出结论，但事实并非如此。我们的目标可能是一个复合目标——在增加GMV的同时控制成本；在增加PV的同时，我们还需要改进GMV；或者直接是ROI等复合指标。在这个时候，我们不仅要*目标，还要*复合指标。例如，我们的目标是在控制成本的同时提高GMV。为了进一步简化问题，我们具体定义了促进老用户产生GMV和获取新用户产生GMV的成本。因为在操作中，拉新和促进活动的手段通常是不同的，这与[细分]部分的原则相对应，即是否有操作空间和操作空间的大小。之后，我们可以根据不同的纬度来细分GMV和投资成本。例如，在创新方面，我们有外投百度关键词、外投广告联盟和与其他应用程序的合作交换；在促销方面，我们在应用程序上的四个ABCDBaner上设置A/BTest。因此，对于新用户部分，我们可以评估百度关键词、广告联盟和合作应用程序每1元的成本可以获得多少新的GMV。通过这种评价，我们可以简单地选择更好的方式，并在现有的方式中调整更好的成本投资。对于老用户，我们也可以针对ABCD四个Banner的A//BTest，在不同的显示版本中，每一美元能产生多少GMV。简而言之，在[评估]步骤中，我们需要将[总结]部分的指标分为两类——最终目标和实现目标的手段。例如，在前面的例子中，投资成本是实现GMV改进的手段。因此，我们需要用GMV来评估每一美元的成本投入。此时，为了实现GMV改进的目标，有更多的选择。例如，对于老用户来说，我们可以：保持成本投资不变，更换更容易带来GMV的图片和文案，以提高GMV（优化效率）；保持每一美元带来的GMV不变，(在限制范围内)增加成本投入。这两种方法都有意识地忽略了GMV可能带来的价值。如果我们考虑到这部分价值，它可以抵消部分投资的成本，那么将会有更多的替代方案。简而言之，在前面的例子中，由于我们的拆分维度本身相对简单，我们只考虑应用程序中的banner和外部新方法，因此更容易通过数据中的一些标记进行细分。但在实战中，有些情况是我们无法明确拆分的。例如，在用户交互中，GMV的路径需要通过几个链接跳转，或者ABCD的四个横幅就像前面示例中的一样。如果用户点击两个甚至三个横幅，我们如何分解它们？这个问题是下一步[归因]。1.1.归因[归因]这一步是“最后一公里”，也就是我们常说的分析“为什么”的过程，然后就可以得出结论并做出决定。在前面的步骤中，我们可以通过案例清楚地看到，我们已经得到了一些可以直接比较的量化指标。事实上，在这种情况下，我们不需要在[归因]步骤中进行任何特殊操作，可以通过数值比较直接得出结论。但是，如果我们遇到细分的问题，即多个环节或方法之间不能明确拆分，我们该怎么办？日常数据分析中有几个常见的归因思路:比如我们继续使用上面提到的案例——用户**依次点击ABCD，然后GMV就产生了。：**第一个互动归因模型**：也就是说，用户第一次做某件事，通常表现为数据中的时间最早、顺序号最小等。然后我们给A记100%，B、C和D记0%。**最终交互归因模型**：也就是说，用户最后一次做某件事，对应的数据表现为最近的时间，最大的顺序号等等。然后我们给D记100%，A、B和C记0%。**线性归因模型**：也就是平均分。然后我们分别记住ABCD的25%。**加权归因模型**：也就是说，将一定的权重分配给多个促成因素，如A和B各记30%，C和D各记20%。由于多了一个权重维度，需要一定的设计；而且计算权重也可以作为一个分析过程。还有几种常见的权重设置方法，如第一项和最后两项最重要的项目，其他项目向中间递减，或按时递减等。当然，在选择归因模式时，也会结合具体业务的特点，考虑行为顺序、停留时间等，对分析目标的贡献或影响。1.1.决策最终可以做出决定。然而，在前几步逐渐消除不确定性后，决策是最简单的一步——找出最好的版本、最好的位置和最好的方法。当我们有一些新的想法时，我们也可以将其添加到这个评估系统中作为A/BTest的版本进行综合评估。1.2应用案例这套方法论不仅可以针对日常工作中的专项分析，还可以在一些固化成型的方法论中找到这套基本方法论的影子。我们来看几个已经形成的方法论案例:1.2.我们要看的第一个案例是A//BTest实验BTest。在A/BTest的过程中，首先要确定实验的目的，即通过实验改进和优化哪个指标。之后，我们以实验中的不同版本为细分维度，以指标是否实现为评价标准，对实验结果进行评价。假如在实验过程中确实遇到了需要归因的问题，那么还需要考虑如何归因。当然，随着业务复杂性的不断发展，A/BTest的困难不在于比较和得出结论的过程，而在于如何在更短的时间内设计实验，消耗更少的用户流量，进行更多的实验并得出有效的结论。Google的著名论文也是这方面所有平台和工具的起点《OverlappingExperimentInfrastructure:More,Better,FasterExperimentation》讨论的核心内容。1.2.2用户分组用户分组是一种常见的操作方法，但如何确定分组的准确性以及如何在后续使用中持续保持准确性确实是一个数据分析问题。在基于特征的用户分组过程中，首先要确认的是我们想要获得什么样的特征。之后，当我们想要找到符合这一特征的用户时，我们可以使用TGI（TargetGroupIndex，目标群体指数)来衡量找到的用户群体是否倾向于这一特征。例如，如果我们想找到喜欢有趣短视频的用户，并以拇指行为作为“喜欢”的定义，我们可以使用TGI的大小来评估我们找到的用户组是否真的喜欢有趣的短视频。有了这种分析机制，我们可以通过各种手段对用户进行分组，然后我们可以根据不同的分组方法计算多组TGI值。我们需要的是TGI值最大的子组，并选择获得该子组的分组方法。另一方面，还有另一个关于用户群的场景：我们已经获得了一个用户群，并希望研究该群的特征。此时，TGI也可以作为目标，用TGI的大小来衡量分组对各种特征的倾向。1.2.3经典管理模型：在经典BCG矩阵中，BCG矩阵的一个*目标是整体利益，而手段是优化资源配置——即将企业中有限的资源投资于更有潜力的业务，以最大化企业层面的整体利益。为了深入研究这一目标，BCG矩阵根据两个维度拆分该指标，形成二维矩阵。在通常的绘画方法中，横向代表相对市场份额（通常指行业前3），纵向代表市场增长率。与市场份额和市场增长率相比，是创造利益的手段。如果份额高且增长快，自然会获得更多的利润，而利益自然是最终目标。因此，由于手段带来的好处不同，在分割的四个象限中，不同的业务有自己的“命运”——有些维护，有些增加资源，有些减少资源，有些直接放弃。根据之前对方法论的总体描述，方法论的优化有三点，可以优化这套方法论。(1)汇总部分的优化在于找到更新、更合适的辅助指标来计算最终目标指标。例如，在金融领域，杜邦分析法与收支汇总的计算方法相比（D

以上就是关于数据分析五步法，这个框架具有几方面特点的相关介绍，更多数据分析五步法，这个框架具有几方面特点相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据分析五步法，这个框架具有几方面特点有更深的了解和认识。

内容来源:人人都是产品经理，以上内容来源于网络，不代表本站观点，如有侵权，请联系删除。

上一条：“用户精细化运营”是什么，它有哪些相关的工作方法下一条：何为内容审核？“先发后审”和“先审后发”的适用场景