2020-12-29 08:43:59 阅读(139)
上周更新了两篇Excel学习文章,有读者反映写作不够实用。在这里解释一下,文字真的很难细化每一步,否则真的要出一本书。文章更多的是一个引导,告诉你为什么要学这个,主要学什么,怎么学。经过深入的操作,我们需要在业余时间加餐。我们已经尽力给你留材料了。还有人建议,制作视频,不错!很赞!在明年的计划下。即使没有时间,我也会推荐一些我认为可以的视频供大家学习。年底,最近几个晚上都在苦苦挣扎的年终报告。你写好了吗?好了,回到正文,这篇文章讲的是数据库知识:职场上经常有刚从事数据分析的孟新,问我做数据分析要学什么,如何规划学习路径。我会告诉他:如果你的Excel仍然使用,首先学习Excel,当你使用Excel处理和分析一些小数据集没有问题(具体性能是:通用函数公式、数据透视表、筛选、排序、图表绘制操作),你学习SQL语言,然后使用BI分析熟悉业务。然后在某个阶段,你可以开始R或Python。以后如果能进一步了解一些大数据框架,比如Spark。为什么要学习Excel?首先,Excel是我们最常用的数据分析和处理工具。Excel具有丰富的功能,基本上可以覆盖我们以后的其他软件(SQL、BI、Python、R)要学的功能。有些人可能会问,既然Excel如此强大,为什么要学习其他工具呢?这是因为Excel是以菜单的形式操作的,很难实现自动化和功能重用。当然,你也可以通过VBA来实现。使用VBA是编程。然而,由于VBA语言只能在office软件中使用,学习的投入成本和产出收入不成比例,不建议学习,这是客观原因之一;此外,Excel在处理大型数据集时,性能差,经常崩溃。(虽然Excel2013及以上版本声称可容纳1000 一万条记录,但数万条数据开始卡住)。(虽然Excel2013及以上版本声称可容纳1000 一万条记录,但几万条数据开始卡住)。Excel学完SQL为什么要学?客观原因是大多数数据分析岗位都需要SQL技能。为了保证数据的安全性和管理的便利性,数据统一存储在数据库中。SQL语言需要从数据库中提取和查询数据,甚至一些公司也使用SQL语言进行数据分析。另一个原因是,即使你先学习其他工具,比如R,Python,即使是Spark和其他大数据框架,你也会发现你最终必须学习SQL。假如你先学SQL,那么很多概念你都可以学R,Python,在Spark和其他更复杂的工具之前就清楚了。将有助于以后的学习。就像盖房子一样,先打地基,再一层一层盖。SQL语言学习排在Excel之后,在其他工具之前,另一个重要的原因是SQL可以帮助Excel在一定程度上解决大数据集的问题,并建立通往其他工具的桥梁。对数据库和SQL的研究也分为两部分,第一部分是关于数据库和表的概念。第二篇是SQL语句的掌握和数据库的操作。一、数据库的基础知识先说说我对数据库的理解。顾名思义,数据库是由数据表组成的数据集。在物理实体上,是一堆写在磁盘上的文件,文件中有数据。这些最基本的数据构成了表(table),我们把它想象成Excelsheet,如下图所示:每张表都有一个唯一的标志,即主键,即ID。ID是数据库中的一个重要概念,称为唯一的识别符/用来表示数据的独特性的主键。相当于我们的身份证,是唯一的,有了身份证,就知道数据在哪里了。ID通常没有业务意义,是唯一的标志。每张表只能有一个主键,主键通常是整数。一旦设置了主键,通常不允许修改值。数据库是表的集合。多个表可以放在一个数据库中,我们命名每个表,表可以相互连接。联系是数据可以相应匹配,官方名称叫联系,相应的操作叫Join,我们想象成Excel中的vlookup。比如上面两张图,左边是学生信息表,右边是老师信息表。左图主键为学生ID,右图主键为教师ID。细心的读者可能会发现右图中还有一个学生身份证,这里的学生身份证是专门用来连接用户表的,而不是主键。只有两张表是通过学生ID的唯一信息来关联的。然而,两个表之间的关联并不是信息可以一一对应的,也会有空缺。例如,两个表之间的连接将成为:了解上述概念,您将知道什么是关系数据库。简单来说,它是一个由多个二维行列表组成的数据库,可以相互连接。在准备数据时,我们通常需要建立表关联进行分析。关系数据库是基于关系代数模型开发的,常用的关系数据库是SQLServer、MySQL、Oracle、DB2等,这取决于企业的使用,我们的后续学习主要是MySQL。各关系数据库(不感兴趣可跳过):DB2:关系数据库适用于大型分布式应用系统。它确实是一个非常非常好的数据库。它的稳定性、安全性和恢复性无可挑剔,非常适合从小规模到大规模的应用。但是使用起来很麻烦,安装的时候要求很多。很多软件可能会和DB2发生冲突,因为DB2通常安装在小型机器或服务器上,所以在PC上安装起来很麻烦。建立一个新的图书馆需要设置很多东西来分配各种存储空间。Oracle:它是目前市场份额最大的数据库。当我学习SSH时,我使用Oracle。安装起来很麻烦,程序文件有3G。。。使用起来很方便。对于像我这样的初学者来说,有一个非常简单的配置。对于要求高的企业应用程序,也有非常复杂的配置和管理方法,有一个强大的数据字典,可以说是最实用的数据库,但检查,价格不菲…MSSQL:一开始用的是2000和2005版,这两个版本差了很多。2000数据库做得很好,程序小,操作简单,功能齐全。它是一个中型数据库,在各个方面都非常适中。我的毕业设计是MSSQL2000。2005年增加了很多功能,比较复杂,有大数据库的风格,价格也变高了。个人认为,除非使用Windowserver系统或Microsoft产品,否则最好使用oracle。MySQL:MySQL是一个很好的关系数据库,免费,功能齐全,程序小,安装简单。现在很多网站都用MYSQL,字段约束差一点,其他都不错,和MSSQL差不多。Access:典型的桌面数据库,感觉做一个单机系统,比如记账,记事,在局域网上跑个小系统就够了,数据源连接很简单,因为是Office数据库,Windows有自己的数据源。Access:典型的桌面数据库认为做一个单机系统,比如记账和记事。在局域网中运行一个小系统就足够了。数据源连接非常简单。因为它是Office数据库,Windows有自己的数据源。有关数据库的更多信息,请阅读数据库系统概论。2、试着使用MySQL数据库。如果您还没有接触过数据库或SQL,建议您下载并安装MySQL数据进行尝试。MySQL数据库的下载和安装相对简单,安装后即可使用。您可以访问MySQL官方网站下载,网站如下(Windows版本下载地址):「链接」下载MySQL时,需要免费注册,注册页面为英文。下载工具后,点击操作,该程序可以自动为您安装MySQL,并自动配置。在安装过程中,您需要设置密码,自己设置登录密码,并记住下次登录MySQL时需要密码。解压后没有my.我在截图中添加了ini文件(我的端口设置的3308)。管理员命令:在MySQL安装目录的bin目录下执行命令:mysqld–initialize–console得到以下结果:看到一个警告,查看mysql,建议使用utf8mb4修改my。.没有ini文件警告,上面打印了默认密码:nj>UUJkpH4/I,安装服务:mysqld–instalmySQL8.0由于这是计算机上的第二个mysql,所以服务名改为MySQL8.0启动服务:netstartMySQL8.0.修改初始密码登录mysql后执行:ALTERUSER‘root’@’localhost’IDENTIFIEDWITHmysql_native_passwordBY‘123456’;默认情况下,将MySQL与Excel或其它数据分析工具连接起来,有一个插件允许MySQL数据库连接到Excel。想象一下,我们通过SQL语言在MySQL数据库中处理和计算大量数据,将计算结果存储在特定的数据表中,然后通过Excel连接到MySQL数据库,将数据读取到Excel中,用Excel分析和绘制图表。避免了将数据从数据库中导出并导入Excel的麻烦,能否提高效率?以后,我们将通过ODBC驱动程序连接一些报告BI工具进行分析。稍后,我们将通过ODBC驱动程序连接一些报告BI工具进行分析。关于MySQL的学习推荐书《MySQL一定会知道》。
以上就是关于新入行数据分析的学习路径规划的相关介绍,更多新入行数据分析的学习路径规划相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对新入行数据分析的学习路径规划有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一