2020-12-31 10:49:41 阅读(161)
在本文中,我将展示如何使用pandas和ggplot来分析iPhone的步行数据,我主要使用rodeo(Yhat’s的IDE)对数据进行分析。首先,我想从我的iPhone中导出步行数据进行分析。QuantifiedSelf实验室的工作人员开发了一种方便的数据提取工具——QSAccess。QSAccess应用程序可以提取一个CSV文件,其中包含三列变量-开始时间点、结束时间点和步数。我主要使用pandas中的时间序列分析工具来分析数据。当WesMckinney开始处理pandas项目时,他已经在一家投资管理公司工作,广泛依赖于时间序列分析方法。因此,pandas包含了大量的时间序列分析函数。首先,当我们有时间序列数据时,我们可以定义参数parse_dates,使pandas能够正确处理时间序列数据。对我们来说,终点变量不包含额外有价值的信息,因此我们在分析过程中不会考虑变量。最后,我们将开始时点变量设置为索引变量,这将有助于我们进一步分析数据。如何快速绘制和分析每小时步行数据的现有步行数据?不幸的是,我们无法从上图中获得更有价值的信息。我们应该如何提高可视化效果?我想到了一个好主意——我们可以使用pandas中的resample函数来改变数据集的时间粒度。更准确地说,我们可以使用downsampling来降低时间频率。例如,我们可以收集每小时的数据,然后通过重新抽样和汇总计算来获取日数据、周数据和月数据。从上图可以看出,每日步数有上升趋势。随着时间的推移,步行的距离越长。每周和每月步行数据的获取与上述代码相同,只要W和M传输到resample函数中,就可以获得每周和每月步行数据。因为我更关心日常运动,我会用平均函数来计算每周或每月的平均日步行情况。我很好奇的一件事是:工作日的运动量是否大于周末的运动量?我们可以用weekday和weekday_name两种方法来帮助分析。前者可以知道每个时间戳数据属于一周中的第几天,后者可以知道时间点对应的时间名称信息。在添加了这两个新变量后,我们还可以添加一个布尔变量来表示一个时间点是否是周末。此外,我们还可以根据变量weekend_bool进行分类汇总,并对两组数据的差异进行比较。从上述结果可以看出,周末每天的平均步数为11621步,中位数为10228步,而工作日每天的平均步数为10146步,中位数为9742步。因此,我们可以认为周末的运动量更大。趋势分析最后,让我们讨论上述上述上升趋势。4月初,由于工作原因,我从夏洛特搬到纽约担任Yhat软件工程师。我想知道这次搬家后,我的日常步行是否发生了变化?我们可以用上述方法来分析周末和工作日的步行情况。从上图可以很容易地看出,自从搬到纽约以来,每天的运动量确实增加了。但是这是由很多因素决定的,比如我搬到纽约城后,我的跑步次数增加了,这样每天的平均步数都会增加。如果我们想进行更深入的分析,我们需要获得更多的数据支持。由于空间问题,我们将继续在以后的文章中进行分析。总结一下,希望这个分析能让你开始关注自己的日常步行,用Rodeo和pandas来分析数据。如果您对此项目感兴趣,请参考此链接。
以上就是关于如何利用Rodeo分析 iPhone 的步行数据?的相关介绍,更多如何利用Rodeo分析 iPhone 的步行数据?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对如何利用Rodeo分析 iPhone 的步行数据?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一