2021-01-05 11:41:34 阅读(171)
转化率是网站分析中最受关注的指标之一。如何设定转化率目标?哪些用户最有可能转换?它们的特点是什么?如何找到和找到这些用户?这些都是负责网站运营和营销的学生最关心的问题。本文通过贝叶斯算法分析了网站中已转换的历史用户数据,发现了购买转换用户的特点,并通过交叉细分预测了不同用户购买转换的概率。贝叶斯是一种分类和预测算法,我们在前一篇文章中详细介绍了它的计算过程。贝叶斯通过已知的P(B |A)P(A|B)的概率。如果P(A)和P(B)相互独立,成为简单的贝叶斯(NaiveBayes)。以下是贝叶斯的计算公式:我们将通过这个公式预测用户的转换概率。以下是人工生成的数据表截图(需要注意的是,这些数据是人工生成的示例数据,而不是真实的类别和来源性能)。这类数据表可能来自网站服务器日志、CRM系统、用户研究报告或网站数据报告。在这个简单的数据表中,只有两个字段:类别和是否购买。该类别表示用户访问的页面所属的商品类别,是否购买表示用户最终是否付款。是否购买这个数据表是我们关注的结果。类别是维度。在使用贝叶斯公式开始计算之前,我们首先需要将数据表转换为由维度和结果组成的频率表,它包含四种信息:每个类别的用户数量。购买和未购买用户的数量。购买和未购买不同类别的访问者数量。用户总数。贝叶斯算法中所需的概率值由用户的四种信息计算。在生成频率表的过程中,需要注意的是,结果信息(购买/未购买)应该放在列表的位置,维度信息(数字、家居)应该放在线的位置。我们将通过频率表生成用于计算的似然表。以下是贝叶斯算法所需的概率值,这是一个似然表。我们比较贝叶斯公式:P(A)=P(购买)是完成购买的概率,P(B)=P(数码)是数码类别的概率,P(B|A)=P(数码|购买)是已购买的用户中数码类别的概率。这些概率和相应的位置标记在下图中。将相应的概率值代入贝叶斯公式,找出各类的购买概率。以下是以数字类别为例计算的购买概率。将其他类别的数据代入贝叶斯公式,找出所有类别的购买概率。每个类别的购买概率值如下表所示。个概率值可以理解为不同类别的转化率。这里有两个问题需要解释。首先,预测的概率数据可能不准确,因为我们只考虑单维因素(类别)。影响用户购买的因素很多,类别维度可能不是最重要的因素。就像我们看到一个黑人认为他来自非洲一样。仅仅依靠肤色的单一维度来判断结果可能不准确。其次,我们可以通过现有数据找到这个分类的转化率,而不需要通过复杂的贝叶斯算法来计算。此外,该预测数据对寻找新的转化用户和优化购买转化率没有明显的支持作用。因此,为了获得更准确、更有价值的预测数据,我们需要在更广泛的数据源中添加新的维度。与以前相比,下面的数据表增加了一个新的维度“来源”,我们通过来源和类别两个维度重新计算转换概率。计算方法和以前一样,先分别计算并生成两个维度的频率表。以下是来源和类别维度的频率表。在频率表的基础上,产生来源和类别维度的似然表。所需的概率值标记在下图中。将显然表中的概率值代入公式,找出所需的概率值。以SEM流量在数字类别中的购买概率为例。将渠道和类别的概率值分别代入公式,以获得分源的类别购买概率。如下表所示。可以发现,与以往相比,每个类别的转换概率都与源维度进行了交叉细分。对比细分后的类别转换概率后,可以发现每个流量源对不同类别的转换概率。例如,对于数字类别,EDM流量和社交媒体的购买概率高于其他来源。在这一步中,你可能还想知道每个流量源的特征和不同类别的转换概率。以来源为主要维度,重新组织数据,分析不同流量来源的特征和不同类别的转换概率。以SEM流量为例,在示例数据中,SEM流量在汽车、书籍和户外类别中的转换概率较高,数字和服装的转换概率一般,家庭类别的转换概率相对较差。到这一步,我们已经有了交通源和类别交叉的概率。与以往单一类别维度转换概率相比,更准确,对流量渠道的选择和广告投放有一定的初步指导作用。但这些数据不是基于人的,不能帮助我们找到用户的特征以及如何找到更多的转换用户。因此,我们需要增加与人有关的维度。这些数据可能不在网站日志中,它们可能来自用户研究或其他渠道。下面的数据表增加了用户的人群属性信息,如月收入、婚姻状况、教育背景和星座,这更接近网站分析的真实情况。我们重新调整视角,将关注和分析的维度从流量来源转变为与人相关的属性。首先是用户的月收入属性和类别。在这里,我们假设类别是用户访问的目的。以服装类为例,通过月收入与类别维度的交叉细分,可以发现月收入在1.5万元以上的用户完成购买的概率较高,而月收入在5万元至1万元的用户完成购买的概率较低,为0.38。重新整理两个细分维度的顺序,以月收入为主要维度,可以发现用户在不同收入范围内购买类别网站商品的概率。以15001-2万元为例,购买书籍、汽车、母婴和服装的概率较高,而购买家居和户外类别的概率相对较低。两个维度的购买概率预测明显优于单个维度的结果。因为我们掌握了更多的信息,减少了结果的不确定性。但是这还不能回答这篇文章开头的问题,哪些用户最有可能转化?如何找到这些用户?它们的特点是什么?因此,需要引入更多的用户属性。为了更好地细分和定位用户,我们将维度增加到3个维度。在下面的数据表中,我们交叉细分了类别、教育背景和婚姻状况,并建立了不同用户的购买概率表。与两个维度的概率表相比,三个维度的概率表在内容和计算上都翻了一番(这只是增加婚姻状况后的情况,如果增加星座维度会更复杂)。多维概率表应由程序计算和维护,而不是手动计算。三维交叉后的购买概率表可以更准确地描述用户属性,并定位用户的购买偏好。对于具有大专学历和未婚学历的用户,我们可以根据历史购买数据来判断他购买户外用品的概率为0.94。或者从另一个角度来看,对于汽车类别,未婚研究生用户的购买概率可能比已婚小学用户高0.2(0.81-0.61)。这次购买的预测概率准确吗?按照这个概率去寻找用户投放广告一定会有收获吗?答案不一定。概率只是这件事发生的可能性,并不意味着这件事一定会发生。因为实际情况比模型复杂得多,以服装类别为例,也可能涉及季节性因素、品牌因素和价格因素。因此,我们还需要根据每次预测的结果不断调整和优化模型。最后,本文中的所有数据都是人工生成的示例数据,只是为了解释分析思路和计算过程,没有任何代表性。
以上就是关于叶斯算法分析购买转化用户的特征的相关介绍,更多叶斯算法分析购买转化用户的特征相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对叶斯算法分析购买转化用户的特征有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一