2020-12-28 14:08:43 阅读(192)
数据分析有三个问题:如何进入数据分析?数据分析的工具有哪些?如何进行数据分析?至于第一个问题,读完我微信官方账号《10周入门系列文章》的同学应该有一个大致的了解。今天开始谈第二大问题——数据分析工具!对于数据分析,我一直强调核心是业务,它通过业务分析逻辑影射到数据分析的处理逻辑,而数据分析工具是帮助我们实现结果的手段。但是,你说工具不重要,他很重要,就像选择什么样的道路,什么样的交通工具,合适的工具可以帮助我们更快地到达终点。对应数据分析的不同环节,也要选择不同的工具,甚至更容易上手。今天的文章是来扫盲工具的。1、从工具属性和分析师需求来看,企业中的数据分析师往往分为业务和技术。他们的能力和工作内容差别很大,他们也关注工具的要求。业务或技术业务分析师通常在运营部、市场部、销售部等。根据服务业务部门的不同,可称为数据运营、业务分析、会员分析、业务分析师等。由于每条业务线考虑的问题不同,分析思路和系统也不同,因此会有这种差异。日常工作更多的是整理业务报表,对特定业务进行专题分析,围绕业务增长计算、规划、方案等。IT部和数据中心经常有技术分析师。分为数据库工程师、ETL工程师、爬虫工程师、算法工程师等。在中小企业中,一个技术兄弟经常吃这些流程。在大型企业中,一个标准的数据中心通常有数据仓库、专题分析、建模分析等小组来完成数据开发。无论公司有多大,都有专门负责数据管理的小组。之所以有这种区别,是因为生产数据需要一个多层次复杂的数据系统。数据系统需要数据采集、数据集成、数据库管理、数据算法开发和报表设计。只有这样,分散在各个地方的数据才能一点一点地集中起来,计算成常用的指标,并显示成各种酷炫的图表。这里的每一个环节都需要相应的技术支持和人员工作,所以有不同的职位。分析师可以分为技术和业务,相应的工具也有这样的属性重点。对于初级数据分析师来说,分析工具需要玩Excel,熟练使用数据透视表和公式,VBA是加分。另外,还要学习统计分析工具,SPSS作为入门比较好。对于高级数据分析师来说,使用分析工具是核心能力,VBA基本上是必要的,SPSS/SAS/R至少要熟练使用其中一种,其他分析工具(如Matlab)要看情况。数据挖掘工程师..嗯,R和Python是必要的,要靠写代码来解决。对于初级数据分析师来说,代码工具可以写SQL查询,必要时可以写Hadoop和Hive查询。对于高级数据分析师来说,除了SQL,学习Python是必要的,用来获取和处理数据是事半功倍的。当然,其他编程语言也可以。Hadoop熟悉数据挖掘工程师,Python/Java/C 至少要熟悉一门,Shell必须能够使用...简而言之,编程语言绝对是数据挖掘工程师的核心能力。一图说明问题: 二、从企业数据应用架构划分工具的使用,也要看企业的需求和环境。为什么小企业招聘数据分析师实际上是Excel做报告,而大企业寻找数据分析是为了玩python、R?这取决于企业的数据架构。从IT的角度来看,数据工具可以分为两个维度:第一维度:数据存储层-数据报表层-数据分析层-数据显示层的第二维度:用户级-部门级-企业级-BI级、数据存储层数据存储设计到数据库概念和数据库语言,这方面不一定要深入研究,毕竟有专业的DBA。但至少要了解数据的存储模式、数据的基本结构和类型。SQL查询语言必不可少,精通最好。可以从常用的selece查询、update修改、delete删除、insert插入的基本结构和读取入手。Access是最基本的个人数据库,常用于个人或部分基本数据存储;MySQL数据库是部门级或互联网数据库应用的必要条件。此时,关键是掌握数据库的库结构和SQL语言的数据查询能力。SQLServer2005或更高版本,对于中小企业,一些大型企业也可以使用SQLServer数据库,事实上,此时除了数据存储,还包括数据报表和数据分析。DB2和Oracle数据库都是大型数据库,主要是企业级的,尤其是大型企业或需要大量数据存储的企业。一般来说,大型数据库公司提供非常好的数据集成应用平台。BI级别,其实这不是数据库,而是基于企业级应用的数据仓库。DataWarehouse,基于DW机的数据存储基本上是商业智能平台,整合了各种数据分析、报表、分析和显示。2、报表/BI层企业存储数据需要读取和显示,而报表工具是最常用的工具,尤其是在中国。过去,大多数传统的报告都解决了显示问题。现在,一些分析报告工具已经衍生出来,并将与其他应用程序交叉进行数据分析报告。通过接口开放功能、填写和决策报告功能,可以打开数据进出,涵盖早期商业智能功能。就像Tableau、PowerBI、FineBI、BI(商业智能)工具,如Qlikview,涵盖报表、数据分析、可视化等多层次。底层还可以连接数据仓库,构建OLAP分析模型。3、其实数据分析层有很多分析工具,当然Excel是我们最常用的。Excel软件,首先版本越高越好,这是肯定的。当然,对于Excel来说,很多人只掌握了5%的Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析!但我也常说,有能力把Excel玩成统计工具,不如专门学习统计软件。SPSS软件:当前版本为18,名称也改为PASWStatisticss;从DOS环境下的3.0编程分析到当前版本的变化,我也可以看到SPSS社会科学统计软件包的变化,越来越重视医学和化学的商业分析,现在已经成为一个预测分析软件。SAS软件:SAS实际上比SPSS更强大,SAS是平台,EM挖掘模块平台集成,相对来说,SAS更难学习,但如果你掌握SAS会更有价值,如离散选择模型、抽样问题、交叉实验设计或SAS更容易使用,此外,SAS学习材料更多。还有Python和R,以后会详细讨论。4、表现层表现层又称数据可视化,上述工具几乎提供了一点显示功能。但BI是企业级最常用的应用,做分析做报告。 三、四大工具盘点上面这么多啰嗦,具体来说Excel、R、Python、BI吧。>>>>Excel应用场景:1.一般办公需求下的数据处理;2.中小企业的数据管理和存储(许多国有企业使用);3.学校学生、教师做简单的统计分析(如方差分析、回归分析);4.结合Word,PowerPoint制作数据分析报告;5.数据分析师的主要分析工具(部分数据分析师的辅助工具);6.制作一些商业杂志、报刊图表(数据可视化);优点:1。易用;2.学习资源丰富;3.可以用Excel做很多事情,比如建模、可视化、报表、动态图表;4.在进一步学习其他工具之前帮助你(比如Python,R),理解许多操作的含义;缺点:1。深入学习需要掌握VBA,难度仍然很高;2。当数据量较大时,会卡住;3。到Excel2016版,Excel数据文件本身只能容纳108万行,不适合处理大规模数据集;4。内置统计分析类型太简单,实用价值不大;5.与Python、R语言等开源软件不同,正版Excel需要付费。比如我用office365,一年要交300多元(但也值)>>>>R使用场景:通过扩展的第三方R包,R所能做的几乎涵盖了任何需要数据的领域。就我们的一般数据分析或学术数据分析而言,R能做的事情包括但不限于以下几个方面:1。数据清理和整理;2.网络爬虫;3.数据可视化;4.统计假设检验(t检验、方差分析、卡方检验等);5.统计建模(线性回归、逻辑回归、树模型、神经网络等)。);6.数据分析报告输出(Rmarkdown);R容易学吗?就我个人而言,入门R非常简单。10天的集中学习完全没有问题,掌握R的基本使用、基本数据结构、数据导入导出和简单的数据可视化。就我个人而言,开始R非常简单。10天的集中学习,掌握R的基本使用、基本数据结构、数据导入和导出,以及简单的数据可视化,完全没有问题。有了这些基础,当遇到实际问题时,找到需要使用的R包,通过阅读R的帮助文档和网络上的数据,可以相对快速地解决具体的问题。>>>>Pythonr语言和Python都是需要编程的数据分析工具。区别在于R专门用于数据分析领域,科学计算和数据分析只是Python的应用分支。Python还可以用来开发web页面、游戏、系统后端开发和运维。目前的趋势之一是Python在数据分析领域正在追赶R,在某些方面已经超过了R,如机器学习、文本挖掘等部分编程领域,但R语言在部分统计领域仍有优势。Python在数据分析方面的发展,很多地方都借鉴了R语言的一些特点。所以,如果你还是一片空白,还没有开始学习,如果你想决定学R还是Python,建议从Python开始。Python和R更容易学习,但如果你同时学习,很容易混淆,因为它们在很多地方非常相似,所以建议不要同时学习。等一个掌握到一定程度,再开始学习另一个。Python能做什么?1.网络数据爬行,Python可以轻松编写强大的爬虫,抓取网络数据;2.数据清理;3.数据建模;4.根据业务场景和实际问题构建数据分析算法;5.数据可视化(个人感觉不如R好用);6.机器学习、文本挖掘等高级数据挖掘与分析领域;应该学R还是Python?如果由于时间有限,只能选择其中一个学习,我建议使用Python。但我还是建议两者都知道,毕竟每个人都不一样。也许你在某些地方听说Python在工作中更常用,但在工作中,解决问题是最重要的。如果你能有效地用R解决问题,那就用R。事实上,Python的许多数据分析特征都是通过模仿R来实现的,比如pandas的数据框,正在开发的gggplot可视化包模仿R语言中非常著名的ggplot2.>>>>大多数BI分析师的日常工作都是做报告,而数据分析师更多地使用BI。在传统企业中,BI全称商业智能,是一套完整的解决方案。有效整合企业数据,快速做出决策报告。涉及数据仓库,ETL,OLAP,模块,如权限控制。BI工具主要有两种用途。一是利用BI制作自动化报告,数据工作每天接触大量数据,需要整理总结,工作量大。这部分工作可以由BI自动化完成,从数据规则、建模到下载。另一种是利用其可视化功能进行分析。BI的优点是提供比Excel更丰富的可视化功能,操作简单美观。如果每天需要两个小时才能画出来,BI会缩短一半的时间。BI作为企业级应用,可以连接公司数据库,实现企业级报表的制作。这一块涉及数据架构,就不深入讨论了。关于BI,比如Tableau、PowerBI、FineBI、BI(商业智能)工具,如Qlikview,涵盖报表、数据分析、可视化等多层次。底层还可以连接数据仓库,构建OLAP分析模型。就我个人而言,BI工具无疑是最容易快速开始数据分析和培养早期数据思维的工具。
以上就是关于数据分析工具怎么挑选?哪些简单易上手?的相关介绍,更多数据分析工具怎么挑选?哪些简单易上手?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据分析工具怎么挑选?哪些简单易上手?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一