首页 >知识讲堂 >数据分析知识>转数据挖掘需要掌握哪些基本技能?

转数据挖掘需要掌握哪些基本技能?

2021-01-05 13:48:52 阅读(233 评论(0)

无论是数据分析师还是数据挖掘工程师,我们的目标都是了解数据,从数据中找到所需的信息。做数据分析所需的技能,统计知识肯定是必要的,Excel、SPSS、R等是需要掌握的基本技能。我做数据挖掘,所以我专注于数据挖掘的技能。我主修数学,接触数学更多。数据挖掘需要一定的数学知识,如线性代数、高等代数、凸优化、概率论等。例如,简单的贝叶斯算法需要概率知识,SKM算法需要高代数或区间论知识。当然,您可以直接设置模型,R、Python有现成的算法包,可以直接应用。但是如果你想深入学习这些算法,最好是学习一些数学知识,也会让你以后的道路更加顺畅。我们经常使用的语言包括python、Java、C或者C ,我更多地使用Python或Java。有时用Mapreduce写程序,然后用Hadop或Hyp处理数据,如果使用Python,它将与Spark相结合。工作内容的数据分析更倾向于统计分析,绘制图片,做更多的报告,做一些显示。知乎上有一个回答者叫团支书,他更喜欢数据分析。数据挖掘更倾向于建模。例如,我们做百货公司的数据分析。万达电子商务的数据非常大,项目组需要决定具体要做什么。我们从这一点入手,思考百货数据能给我们什么样的业务推广。我们从中挑出一部分用户分组。消费者在商场购物时会有刷卡的数据记录,万达会员卡的卡号信息和购物记录也会出现在数据中,数据量很大。我们使用这些数据进行分类,并将其分为几个用户组,例如偏爱亲子、时尚女装和奢侈品、汽车配件等。分组后向他们推荐相对容易。我们将使用一些聚类模型作为用户分组,如K-means、K-means 等等,处理数据的维度特别大,是300w*142维。如果全部用于聚类,效果不是很好,因为有些毫无意义,所以我们会降低维度。主要成分分析通常用于降维,我们使用深度学习的算法——AutoEncoder。它有一个输入层、一个隐含层和一个输出层。当数据从输入层进入时,它将被编码,当它从输出层出来时,它将被解码。例如,我们灌输142维数据,将隐含层降低到50维数据,输出或142维数据。也就是说,将最初的142维数据投射到50维数据中,然后恢复到142维,这与之前的142维数据相同,所以我们可以使用中间的50维数据进行聚类分析。最后,我们得到了一个评估指标。您可以理解,该指标值越小越好。越小,每个值越接近中心。如果不需要深度学习算法,评价指标在20万左右,降维后得到600多个指标,效果非常显著。我也想告诉你,如果你没有数学知识,你只需要设置一个模型,但总是停留在入门阶段。如果你想成为一名数据挖掘工程师,我建议至少有一种编程语言,数学至少需要线性代数、概率论和突出优化知识,了解一些机器学习算法的推导和深度学习算法。这个学习起来并不特别困难,我从毕业到现在已经有一年的时间了,有些基本算法几乎已经知道了。每个人都有自己的发展偏好。有人会说数学太难了,我不想挖掘,只想做一些数据分析,做一些很酷的分析图,这当然是可以的。如果你想在你的职业生涯中取得长足的进步,不要贪多贪杂,深入某个领域。在那个领域,你可以结合自己的兴趣成为专家。提高自己的技术和业务能力。技术能力相对容易提高,学习R或Python等简单语言非常快,Java或Ca 会比较慢。当技术能力提高到一定程度时,很难与他人有技术差异。也许工作一年的时候,你只会R,两三年后你就会知道相关的工具和技术。这个时候,你和其他同事的区别在于你的专业能力。很多做技术的人一开始会觉得技术很厉害,但是光有技术并不能让你成为公司的核心成员,所以你必须提高自己的业务能力。如果你的技术结果与业务无关,对公司没有好处,除非你是研究人员,否则领导者不会想要这个结果。学校招聘渠道更注重学位,但随着工作经验的增加,你的技术已经达到了一定的水平,你是两三本书实际上和985毕业的人没有太大的不同。当然,对于应届毕业生来说,学历高的学校更有优势,这是大厂的敲门砖。还有人会问是否需要考研。研究生入学考试应该与你未来的工作道路相结合。如果你想进行数据挖掘,你可以选择参加数学专业的研究生考试,这可以提高你的竞争力。根据我的经验,我的本科生是湖北一所非常普通的学校,研究生申请武汉大学的计算数学专业。但由于两分之差,基础数学被调整。当时家里人劝我服从调剂,至少研究生是武大出来的。然而,我对基础数学不感兴趣,这个专业也不能给我想从事的数据挖掘加分。最好在工作中积累一些实践经验,所以我放弃了研究生学习。如果工作几年后需要提高能力,可以再考研,现在不用考了。现在这个行业越来越受欢迎,很多人都想转行做数据分析。转行学习数据分析师是可以的,但是最好先看看招聘单位的工作内容,如果招聘要求了解PPT、不要考虑Excel之类的,因为这通常招聘统计师,而不是分析师,这对你的职业道路没有太大帮助。如果要求Python,、R或者建模,你可以试试。也许别人不一定想要你,但如果你表现出足够的诚意和自学能力,你仍然有机会被录用。当我在大学学习数学时,我只学习了MATLAB。我学了不到一年。当时,我在学校参加了MATLAB建模比赛,并获得了一等奖。我觉得我很棒。但是在找工作的时候发现很多公司不需要MATLAB或者SAS,因为比较贵,很多都会使用开源R。在采访中,我说我不知道R是什么,领导说,给你两周,学习。后来,我在工作中读了一点书,然后开始了。跳到第四个问题,选择数据分析或数据挖掘很多人认为数据挖掘非常强大,但跳到数据挖掘是不可能的。数据挖掘需要较深的代码技能。起初,我不会写代码。毕业后,我去了一家公司。Title是一名中级数据分析师,但我做的是数据挖掘。在刚入职的一个月内,老板让我用Python得出结果。我以前没有学过Python,我边学边做,所以我也学会了Python。后来,我在这家公司做了一个垃圾文本分类项目。我以前从未接触过这方面。我一边查资料一边自己做。刚开始用公式套,准确率只有80%左右。我开始看公式的推导。了解公式原理后,我知道有些地方可以选择最好的,我可以改进算法。不仅要设置公式,还要了解公式推导,了解源代码,慢慢提高自己的代码能力。当然,如何选择大公司是最好的。大公司一般采取学校招聘,如果你通过学校招聘大公司,但非核心职位,如百度搜索挖掘,当然是最好的,如果不能进入这样的职位,最好去一些新开发的公司,如美团,滴滴,这样的公司有一定数据,会有一些强大的人。第三类公司是初创公司。如果刚毕业,最好不要选择创业公司,风险比较大。从表面上看,很难判断这家公司是否能生存,是否有牛人值得跟随。一些二线公司的业务骨干大多来自BAT,经验丰富。向他们学习可以让他们快速成长。如何面试一定要诚实。不要伪造工作经验和年限,没必要,对自己不好。毕业生在求职时可以表现得真诚一点,不能说一开始就能做很多工作,但能表现出自己的学习能力。我不是一开始就做数据挖掘的,而是在工作中慢慢转。假如你真的想做这个生意,就要有决心,不要着急。讲个小故事。当时想转数据挖掘的时候,不知道是选Java还是Cava。 。当时我投入了很多数据挖掘岗位。我知道通过面试的可能性不大,但我和面试官聊天,询问我的经验。我说我毕业于数学专业。如果我想成为一名数据挖掘工程师,我需要掌握哪些能力。面试官画了一张图,一个圆代表数学,一个圆代表计算机。我们需要的是两个圆的交叉部分。如果编程语言快,可以先学Java。;然后我问他需要看什么信息,等等。我们谈了将近一个小时。其实很多老人都很乐意和新人分享。多看看前人的经历,帮助自己成长,一定会在这个行业有所收获。

以上就是关于转数据挖掘需要掌握哪些基本技能?的相关介绍,更多转数据挖掘需要掌握哪些基本技能?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对转数据挖掘需要掌握哪些基本技能?有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

各类商标注册注册大全 进来了解一下

商标是标明商品或服务来源的标志,是将自己的品牌、商品或服务与他人的品牌、商品和服务区分开的标志,其覆盖范围包括文字、图形、字母、数字、声音、三维标志和颜色及其随意组合,是对自我品牌、商品、服务的一种法律保护手段,…查看详情

视频和图片合并成一个视频的软件有哪些?具体推荐如下介绍

现在很多人都特别喜欢制作小视频,而且还会拍一些精美的图片,这样视频跟图片结合在一起,就成了一个比较不错的短片。但是针对视频和图片合成,很多人并不知道应该要选择什么样的软件来使用,其实有很多的软件可以选择,选择对了…查看详情

想要了解加密软件哪个好,可以看详细的推荐

因为现在的人越来越注重自己的信息保护,所以很多人在工作以及聊天的时候不放心,怕怕不法之人监测自己的手机后台,所以很多人都会考虑在手机当中安装一个加密软件,具体来说加密软件哪个好呢?1、易通文件夹锁软件这个加密软件其…查看详情

编程语言排行榜,可以参考一下

在进行程序设计的时候,选择一种编程语言也是必要的,因为属于不能缺少的设计工具,编程语言也是可以让计算机充分接受的,并且具有相关语法规定的语言。而随着生活中越来越多的计算机使用,以及技术方面的进步,现在的编程语言自…查看详情

小程序开发公司哪些比较靠前?小程序开发口碑好的公司介绍

小程序的开发对一些企业的发展也是非常重要的,因为现在是一个使用小程序比较火爆的时代,不少的商户以及企业都拥有自己的小程序,而且利用小程序能够带来更多的客流量,也能够将自己的产品更好的进行推广。所以说很多企业也都想…查看详情

为什么越来越多企业开始布局小程序?

继万商云集小程序斩获“2019年度中国IT互联网产品创新大奖”以来,最新一批上线万商云集小程序的30+企业新鲜出炉啦~简阳XX生态农业、北京XX科技、西安XX劳务、北京XX文化发展、陕西XX商贸、北京XX教育、西安XX科技环保、陕西XX建筑...查看详情

知识产权专利申请流程是什么样的

知识产权专利申请流程是指在保护发明创造的知识产权方面,从申请到授权的一系列步骤和程序。以下是一个常见的知识产权专利申请流程的概述: 1.发明创造:首先,申请人需要进行技术研究和创新活动,发现或开发出新的发明性创造。…查看详情

windows10命令提示符在哪个文件夹

  Windows10是目前实用广泛的操作系统之一,它具有许多强大的功能,包括与命令提示符相关的功能。Windows10命令提示符(也称为控制台)是一种系统资源,它提供了许多有用的功能,比如查看文件,访问网络资源以及运行计算机上的各种应…查看详情

二手车平台哪个好 十大二手车品牌

  随着消费习惯的改变,无论哪个消费阶层的潜在车主都很好,二手车往往会带来更具成本效益的体验。然而,二手车市场的深度足以说服许多感兴趣的车主;下面万商云集*给大家来详细介绍一下二手车平台哪个好 十大二手车品牌这一…查看详情

电商快递如何实现?电商快递的原则和优势分析

如今,网络越来越发达,为提升企业寄收件效率和降低物流管理成本,电商与快递的合作必不可少,接下来*就把调查到的关于电商快递合作的要点做如下介绍。 一、电商快递的原则: 1、成本原则,在自己销量不是很大的情况,你选择…查看详情

3D建模软件哪个好用 3D建模软件排行榜

  3D建模算是很多的行业都会使用到的一个技能和工作,现在市面上也有很多的这一种软件,下面*就给大家来详细介绍一下3D建模软件哪个好用 3D建模软件排行榜这一块的内容。 3D建模软件排行榜  1、《CAD建模号》  一款在手机上…...查看详情

地名商标注册需要什么材料 地名商标注册所需材料

 现在地名注册商标也是很常见的了,很多人对地名都申请商标保护,下面万商云集*给大家介绍下地名商标注册需要什么材料。 一、地名商标注册需要什么材料  1、地名商标注册需要的材料:  (1)以企业名称申请注册的,需提供营…查看详情

iframe框架使用方法

iframe子页面的js和css父页面怎么调用?找到iframe里面js和css的引用文件路径在父页面里面重新引用下,框架里面引用都是独立的不能共通,框架的意义也在此了否则也就没必要存在了。用iframe嵌套页面时四周的白边如何去掉?可以设...查看详情

免费好用的文件加密软件有哪些 文件加密软件排行榜

  当我们的文件中有着重要的信息,为了保护自己的隐私,不想让他人知道时应该怎么做呢?文件加密软件能够很好的能够很好地对文件进行保护防止信息泄露,那么在众多的文件加密软件面前该如何做出选择呢?下面*就给大家来详细介绍…查看详情

小程序制作费用多少

  做一个小程序商城大概需要多少钱?  制作一个小程序商城的费用大概如下:1,微信公众号或小程序的认证费(300元)2,小程序商城的费用,这一块就要根据选用哪一种开发方式来决定。  使用小程序平台上的话,价格会比较低,一…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询