2021-01-04 11:26:15 阅读(151)
本文使用R语言模拟美国足球比赛的数据,我们将完成以下工作。获取和清理美国足球比赛数据分析和理解美国足球比赛数据构建测量攻击和防御能力指标模拟一个程序决定比赛模拟多个计算决定比赛现在我们获得和清理数据,然后我们需要理解每个数据域的意义,并使用这些数据挖掘有用的信息。如果您已经完成了上述获取和清理数据的步骤,您可以进入以下流程。通过以下步骤对处理过程进行数据分析和探索。1.首先,为了便于后续的数据探索,我们将offense和defense合并成combined数据框。因为offense和defense数据框中有相同的列名,为了避免后续操作的混淆,我们需要唯一命名重名列。同时,我们将排除defense中和offense中重复的比赛数量列。2.现在,我们可以开始探索预处理的游戏数据。直方图一直是初步研究数据的最佳工具之一,因为它可以通过显示每列数据的分布来区分低、高和正常范围内的值。首先,我们为每支球队平均每次进攻得分(offensivepointspergame)创建直方图。如上图所示,大多数球队平均得分在18到28分之间,但有两支球队平均得分明显高于和低于平均水平。所有球队平均进攻得分和标准偏差为23.4和4.36。得分最高的球队得分37.9(比平均值高3.32个标准偏差),得分最低的球队得分15.4(比平均值低1.83个标准偏差)。通过执行下列命令,可以获得上述结果。3.现在让我们观察每个球队对手的平均每场比赛得分(pointsallowed)是如何分布的。如上图所示,球队对手的平均得分波动不大,大多数球队的得分在20到30分之间,只有少数球队控制对手的进攻得分在20分以下,因为他们出色的防守能力。4.我们将创建另一个进攻统计:平均每场比赛的第一次进攻次数(numberoffirstdownspergame)。如下所示,直方图。如上图所示,大多数球队的第一次进攻在17到20之间,而丹佛野马(DenverBroncos)不仅是球队平均每场进攻得分最高的球队,而且首攻数也很高。简单替换上述代码中的列名,就可以为combined的列创建直方图。尝试几次替换,观察是否有新的发现。5.下面将尝试通过创建条形图来理解combined数据集。前面创建的条形图和直方图往往很容易混淆。在这里,两者之间的区别在于,条形图可以描述每个团队在不同评价指标上的差异,而直方图用于显示不同数值段评价指标上团队数量的分布。接下来,我们通过创建每次进攻得分来创建(offensivepoins)详细解读条形图。现在我们可以清楚地看到球队排名按照每场比赛的得分排名。6.现在让我们来看看每支球队失去的码数。(defenseyardsallowed)上述平均表现,命令如下所示。上图显示了DenverBroncos出色的进攻能力和Seattleseahawks强大的防守能力。我们也可以大致猜到球迷将看到的比赛结果。最后,Seattleseahawks凭借强大的防守能力在超级碗的比赛中击败了Denverbroncos。读者可以为更多的变量绘制条形图,从而找到更多有助于预测最终结果的线索。7.最后,我们通过散点图观察两个变量之间的相关性。例如,我们可以绘制球队每场平均进攻得分(offensivepoints)和平均进攻码数(offensiveyards)散点图之间。执行命令产生的图形如下所示。如上图所示,这两个变量呈正相关性。当平均进攻码数增加时,平均进攻得分也逐渐上升。两者之间的线性相关系数可以通过以下命令来计算。8.理论上,球队的平均失败码数(defenseforyardsallowed)平均失分(pointsallowedpergame)它们之间也应该有很强的相关性。让我们通过绘制两者之间的散点图来验证我们的猜想。如上图所示,两者之间确实存在一些正相关性,但两个得分变量之间的相关性并不强。我们还可以计算它们之间的相关系数。9.我们还需要一张散点图来验证我们的猜测:平均得分是否与球队拥有控球权的时间有正面关系。两者之间的散点图与我们的猜想相去甚远。显然,从进攻效率的角度来看,每支球队都有不同的水平,有些球队可以在短时间内快速得分,而有些球队只能得到很低的分数。得分和控球时间较低的相关系数也证实了散点图传达的信息。绘制直方图时,坐标间隔的工作原理(break)有效表达数据信息的数量非常重要,设定的坐标间隔决定了直方图中柱状条的数量。如果break设置合理,直方图可以真正反映不同范围数据频率的差异,但如果设置过多,会导致分析问题。根据我们以前的经验,可以设置break,使图中有10列,然后根据数据的特性进行调整。我们用ggplot2包画条形图。首先通过transform函数对数据框进行重新排序,然后用ggplot2绘制排序后的数据。我们可以修改图形的任何特征,包括轮廓、填充颜色、数据轴样式、图标名称等。同样,ggplot2也可以创建散点图,并任意修改图形元素。在上面的列中,我们修改散点图中的点是镂空钻石(shape=5)。
以上就是关于如何分析和理解模拟比赛数据?的相关介绍,更多如何分析和理解模拟比赛数据?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对如何分析和理解模拟比赛数据?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一