2020-12-01 15:49:36 阅读(149)
我挠了挠头,冥想了好几天,借助一个好朋友的官方账号“历史遗留数据”进行了探索。。。最后,我终于找到了一种适合分析企业号和大量数据的分析方法。我不敢独自享受好东西。我想和你分享。文章中的商品非常干燥,这也意味着大脑燃烧没有下限,但阅读数据操作后的能力大大提高。因此,在开始文本之前,让我们先谈谈本文的布局,让您做好心理准备:首先谈谈聚类分析的一些基本原则,为下一步的数据分析做好理论储备;建立微信文章/内容评估系统和数据捕获,为下一步的数据分析提供优质的“原材料”;案例实践,用生动的实际案例实施方法,让大家在一个案例中彻底了解聚类分析的方法;应用延伸,除了微信内容优化,聚类分析也可以用于APP、网站数据分析和用户肖像分析。2、聚类分析的基本原理1。什么是聚类分析?聚类分析是将可见的物理对象(如桌子、人、树木等)或可见的抽象对象(如情绪、概念等)分组,将具有相似特征的对象分成一个块,形成许多具有不同整体特征的“小组”,同时,这个过程是人为主观的——最后,我们将定义这些分类及其特征,从而将其应用于特定的业务场景。在生活中,我们经常谈论“物以类聚,类以群分”,这意味着不同的人和事因为相似的特征而合并成一个类别,形成了许多大大小小的分组/类别。人们将群分聚类分析作为一种多元化的统计分析方法(研究多个自变量与因变量相关的一组统计理论和方法)。其目的是根据个人或样本的特点对其进行分类,使同一类别下的个体具有尽可能高的同质性,而不同类别/组之间的异质性则尽可能高。人们将群分聚类分析作为一种多元化的统计分析方法(研究多个自变量与因变量相关的一组统计理论和方法)。其目的是根据个人或样本的特点对其进行分类,使同一类别下的个体具有尽可能高的同质性,而不同类别/组之间的异质性则尽可能高。例如,由两个不同爱好者组成的松散组织——粉丝协会和摄影协会。在球迷协会中,所有的足球狂热者都谈论足球;摄影协会的成员都拿着“长枪和短枪”,最大的爱好是“点击”美丽和美丽的风景。这两个团体的成员有着共同的爱好和兴趣;作为一个集体的粉丝协会和摄影协会,由于团体的不同偏好,没有共同点,小团体和小团体之间的价值观和意识形态倾向也非常不同。在进行聚类分析时,需要在相似性的基础上收集数据并对其进行分类,以衡量不同数据之间的相似性,并将数据分类到不同的组/类中。下图显示了两个变量的数据聚类,分类是根据二维空间中点的距离确定的。值得注意的是,聚类分析的用途在于探索性分析,结果可以提供许多可能的“解决方案”。选择哪个“解决方案”取决于分析师对特定业务的判断和他们自己的知识结构。2.操作喵喵的主要步骤是复杂的。恐怕每个人都会看起来头晕。我会通过这些链接,因为在接下来的分析中,喵喵会用新鲜的案例让每个人都“反刍”。聚类分析的工具是SPSS20.0,采用K-means聚类法,分析步骤分为四个环节,以及数据预处理、距离函数定义、聚类或分组及评估结果。聚类分析的四个步骤3。文章质量评价体系和数据捕获操作喵做这个聚类分析的目的是在凌乱复杂的微信背景数据中对数百篇文章进行分类。分类的原理是,这些文章根据各自的特点进行合理的分类,具体来说,由于指标值的不同,在多个指标上进行自然分类。因此,我们需要先找出几个聚类指标),然后对这些指标进行有意义的分类,分为几个维度,以便我们评估文章的质量。一般来说,对于文章质量的分析和评价,我们只关注阅读量和赞美量等指标。更深层次的是分享转发指标,但很少有人全面评价文章质量,分析观众的内容偏好。因此,有必要对文章的质量进行多维评价,而不仅限于阅读量、拇指等“主要指标”,而是探索能够反映文章整体情况的多维评价指标,为我们的内容操作优化提供指导。在本文中,运营喵认为,文章的质量不仅是文章的阅读量和转发量,还包括文章的传播效率、文章本身对目标群体的价值以及能够激发粉丝数量的增长。因此,微信文章质量评价需要一个完整的指标评价体系,从一般粉丝、阅读和转发数据中探索更详细、更全面的“文章肖像”指标评价体系,从多个维度、多层次分析文章的质量。这种多维分析的目的是内容操作是分阶段的。由于精力不足和经验不足,我们应该在每个阶段制定不同重点的内容操作策略:在早期阶段(粉丝不多),文章的沟通非常重要;成熟期(粉丝数量大,增长快,损失快)需要沉淀用户,创造有价值的内容,留住粉丝;在平台期或衰落期(粉丝损失大于增长),竞争产品的出现和用户口味发生了很大的变化,内容需要创新、保留或吸引新粉丝。此时,文章既具有沟通能力又具有价值。值得注意的是,文章的沟通与其自身的价值没有不可避免的关系,一篇高质量的文章,可能有很多收藏,大拇指,但阅读,沟通不一定很大;相反,许多没有价值的文章,因为它们容易阅读,满足用户的心理需求,沟通会更大,阅读和转发会“摩擦”上升。值得注意的是,文章的沟通能力与其自身的价值没有必然的关系。一篇高质量的文章可能有大量的收藏和拇指,但阅读和沟通并不一定很大;相反,许多低价值的文章将具有更大的沟通能力,因为它们易于阅读,并满足用户的一些心理需求,阅读量和转发量将“摩擦”。在此基础上,拥有一套完整、全面的文章/内容评价体系是非常重要的。以下是运营小喵根据研究总结的微信文章/内容质量评价体系,列出了粉丝增长指标、粉丝活动指标、文章信息指标、文章传播指标和文章价值指标五个维度。这五个指标包含多种类型的数据,并尝试细化分析的“颗粒”。详见下图:微信文章质量评价体系粉丝增长指标粉丝增长指标反映粉丝在某一天的增长/关闭,以下包括三类数据——新关注人数、取消关注人数和净增关注人数。其中,“新关注人数”和“净增关注人数”是正指标,即越大越好,而“取消关注人数”是反向指标,越少越好。在不做活动的情况下,这三个指标可以反映当天整体人群的阅读质量——当阅读量足够大,文章足够好时,粉丝数量会增加,通过的人数会减少;如果标题派对诱导粉丝阅读或关注,粉丝数量会很多。粉丝活动指标粉丝活动指标反映了粉丝的活动,包括图文阅读、微信官方账号会话阅读和历史新闻阅读。值得注意的是,这三个指标都是发布后7天内的统计数据,具有一定的及时性,可以反映粉丝对微信官方账号的关注/关注(如果不重视,可能需要很长时间,甚至永远不会打开。极端情况是文章从朋友圈或者朋友转发处看到。值得注意的是,这三个指标是发布后7天内的统计数据,具有一定的及时性,可以反映粉丝对官方账户的关注/关注(如果不注意,可能需要很长时间,甚至永远不会打开。极端情况是,这篇文章是从朋友圈或朋友转发处看到的。)其中,“图形阅读人数”是7天内某篇文章的总阅读用户数。“微信官方账号会话阅读人数”是指从微信官方账号推送的会话中打开的,反映出读者养成了在订阅号中查看推文的习惯,具有一定的忠诚度和活动性。从历史新闻来看,可能有两种情况:一种是粉丝新关注公共账户,将阅读历史新闻中的过去推文,表明ta对公共账户的内容非常感兴趣;另一种情况是,粉丝忘记查看之前的推送信息,看到目前的文章,会有兴趣查看过去的推送记录,两者都反映了粉丝对公共账户的兴趣,可以反映粉丝的活动。文章信息指标文章信息指标是文章发布的基本信息,包括文章标题、文章发布日期和文章发布时间点。这三种数据/信息不能单独分析,需要结合其他维度的数据进行相关分析,以判断文章的质量。文章传播指标文章传播指标反映了微信推送内容的传播力度/效率,因为一般来说,微信推文的生命周期基本保持在一周(在此期间大部分阅读量完成)。该指标下辖四类数据——从微信官方账号分享到朋友圈的数量,在朋友圈再次分享的数量,在朋友圈的读者数量,朋友转发的读者数量。这些指标都是发文后7天内的统计数据,具有一定的及时性,可以反映7天内文章的传播效果。“从微信官方账号分享到朋友圈的人数”是指粉丝在微信官方账号会话中查看推送内容后,再转发到朋友圈再次阅读的人数,也称为“二次传播率”;“朋友圈再分享人数”和“朋友转发的阅读人数”可以理解为“三次传播率”,其传播路径过于复杂,如下图所示:几种不同的阅读路径文章价值指标文章价值指标表示读者对文章内容的认可和赞扬,认为文章给他们带来了一定的价值(如放松、新知识等),该指标有四个指标:总阅读、共享、微信收藏和拇指数量。其中,共享人数和微信收藏人数是发文后7天内的数据,阅读和喜欢的数量是文章发文之日起至今的总数。下表是每个指标的描述和捕获位置:每个指标的捕获位置和意义数据捕获位置(1)群发功能-发送时要注意。这两个数据不同于“图文分析”中的数据。这两个数据是一篇文章历史上的总阅读量(次数)和赞(次数),实时实时,也就是目前看到的数据是从发表文章到现在的所有阅读量和赞。这里的阅读数据不同于“图文分析”。“图文分析”只记录了发文之日起7天内的阅读,没有“赞”的数据统计。这里的阅读数据不同于“图形分析”。“图形分析”只记录了自发布之日起7天内的阅读,没有“拇指”的数据统计数据。总阅读量和拇指数量的数据捕获位置(2)用户分析-用户增长在“用户分析”栏中,需要捕获的数据是关数、增加粉丝数量和净增加粉丝数量。这三个数据更容易获得,并可以在“用户分析”下下下载excel表格。粉丝增长数据捕获位置(3)图形分析-单个图形在“图形分析”栏中,可以在数据概况中获得文章标题、推送时间、交付人数、图形阅读人数和共享人数。值得注意的是,这里的图形阅读和分享的数量是7天内的总数,分享的数量是转发或分享给朋友、朋友圈和微博的重用户数量(包括非粉丝)的总和。文章的基本信息和价值数据捕获位置在微信官方账号与朋友圈分享,在朋友圈再次分享。这两个数据指标可以用图形分析à单篇图文à获取图文细节。从朋友转发的阅读人数、历史新闻和其他渠道获取文章传播指标的位置可以从图形分析à单篇图文à图文详情à趋势图是通过这条路径获得的,但这三个数据需要总结7天的数据。从朋友圈开始的文章传播指标和文章活跃指标的抓取位置(其实也可以在上图中的“朋友圈阅读”中获得)、分享转发人数和微信收藏人数可以在图文中进行分析à单篇图文à通过excel下载处理,可以在图形详细信息的底部获取。如果人工操作,文章价值指标抓取位置上述处理的获取费时费力。如果要统计一年的数据,操作喵就会筋疲力尽。。。这里提供了一个更简单的方法,即使用“网络爬虫”(注:爬虫是一个自动访问网络内容的程序,是搜索引擎的重要组成部分)来捕获数据,可以在节省劳动力的情况下准确地获得大量上述原始数据。以下是上述抓取数据指标的信息汇总表。手动/网络爬虫处理后,获取以下原始数据,篇幅有限,仅显示局部数据:微信背景下多个原始数据4。数据分析实践1。从今年年初的1月中旬到最近的7月中旬,新媒体培训机构账户的案例背景只有半年的时间跨度。半年时间,推文近200篇(包括副文,即第二、第三图)。我们接下来要分析的原材料是本期的文章数据和粉丝数据。这种聚类分析的主要目的是发现质量更好的文章和质量最差的文章,从数据中发现它们,发现它们的特点,发扬优秀的风格(主题选择、标题、内容、排版设计等),避免未来质量差的文章,为了阅读,转发分享,最终实现自己的内容促进粉丝增长的目的。注:在商业保密中,部分内容或数据在不影响数据分析的情况下稍加处理~2。数据预处理和选择聚类方法根据上述捕获数据的方法获取原始数据。需要注意的是,在进行分析时,需要分别分析主副图片和文本,因为一般来说,点击量/阅读量越低,分析仅在同一级别的图片和文本中进行,然后在各级别进行一般内容分析。本文的下一个分析主要是主图文。主副图形分析应分别消除获得的原始数据中的异常值,即去除数据中明显异常大或异常小的数据值,以免干扰整体分析。将上述Excel原始数据导入SPSS,检查数据的“测量标准”是否有误。“测量标准”下有四种数据,即名称、序号和测量。其中,名称是数据分类的数据类型,如姓名、标题等。;序列号是数据排序获得的变量;测量是数据测量获得的数值变量。在原始数据中,日期、标题、发布时间点等数据也属于名称变量(SPSS中不分析时间点),其他变量为测量变量,是关注分析的变量。数据预处理后,按“分析”à分类àK-均值聚类路径选择聚类方法。选择K-均值聚类(K-打开“means聚类”方法K-平均聚类会话框将变量输入“变量”框。在“保存”项目中,检查“聚类成员”和“与聚类中心的距离”,以便在操作后在表格中显示分类信息并判断分类。其中,最重要的环节是根据经验和数字选择“聚类数”
以上就是关于有适合数据量大的、企业级的公众号的内容优化分析方法吗的相关介绍,更多有适合数据量大的、企业级的公众号的内容优化分析方法吗相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对有适合数据量大的、企业级的公众号的内容优化分析方法吗有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一