2021-01-04 09:00:45 阅读(177)
作者决定对该项目进行深入调查,并提供任何想要从商业计算机科学中受益的干货信息——无论你刚刚开始,还是已经充满了所有的技能,但没有相关的行业经验。所以我打算主要回答这两个概览问题:数据科学需要什么技能?怎样才能学会这些技能?从求职市场的角度来看,如何最大限度地提高数据科学岗位的就业机会?你可能会想,为什么我能回答这些问题?因为我每天都喝数据科学家,作为一名高级人力资源人员,我需要了解相关的职业道路,如何成为一名优秀的数据科学家,以及雇主希望招聘什么样的员工。所以我对这件事还是挺了解的。但我也想直接找到那些沿着这条路走下来的人,所以我从不同背景的数据科学家开始,期待着发现不同的东西。这一次,我找到了一位前软件工程师、前天体物理学家,甚至一位前粒子物理学家(这让我非常兴奋,因为他亲自参与了21世纪以来最重大的科学突破之一)。第一章:数据科学是什么?你已经下定决心要成为一名数据科学家。很好,你已经开始了。但是现在你有了另一个选择:你想成为什么样的数据额科学家?因为(认识到这一点非常重要)虽然数据科学多年来一直被认为是一种职业,但没有人认识到它是什么。在现实生活中,“数据科学家”一词可以指非常广泛的工作类型,因此考虑到工业和商业的不同需求,以及问题中不同的目标和输出角色,它有多种形式。因此,在某些方面拥有技能比其他技能要好,这就是为什么通往数据科学的路径是不同的,可以通过统计学、计算机科学和其他科学学科等各个领域来实现。目的是决定数据科学形式类别的最大因素,这也与相应的A类和B类有关。一般来说,分类可以总结如下:人类数据科学(A类),例如:分析支持基于证据的决策软件数据科学(B类),例如:智能推荐系统,如Netflix和Spotify,当这个领域越来越成熟时,我们可以看到这些定义将越来越完美,这里我们也想介绍我们的第一位专家:YanirSeroussi,Yanir目前是CarnextDor的首席数据科学家。在我们深入研究之前,值得花一点时间反思“数据科学”中的“科学”,因为从某种意义上说,所有的科学家都是数据科学家,因为他们处理各种数据。在我们进行深入研究之前,值得花一点时间反思“数据科学”中的“科学”,因为从某种意义上说,所有的科学家都是数据科学家,因为他们处理各种数据。但考虑到通常被认为是数据科学的行业,是什么使它成为一门科学呢?这个问题很好!答案应该是:“科学方法”。考虑到科学的多学科性,科学的方法是将这些领域结合起来。然而,业内的职位名称似乎越来越宽松,并非所有的数据科学家都是真正的科学家。你可以问自己:即使你的工作不包括真正的科学,你也能证明自己是一个科学家吗?就个人而言,我不认为“分析师”可以作为一种选择,或者其他最合适的选择也可以作为一种选择。但这可能只是我个人的意见,也许我最好称自己为招聘科学家。通过讨论,我们将继续探索你需要掌握哪些领域的专业知识(如果你还没有)。1.如果这不是你名单中的第一个,请立即修改它。所有科学的核心都是解决问题:一个伟大的数据科学家也是一个伟大的问题解决方案;太简单了。需要进一步的证明吗?基本上,我在这个项目中遇到的每个人(无论其背景和当前的工作环境如何)都提到,数据科学中最重要的因素是解决问题。很明显,你需要有工具来解决问题,但它们只是:工具。在这种情况下,即使是统计/机器学习技术也可以被视为你解决问题的工具。新技术出现,科技进步。唯一不变的就是解决问题。在某种程度上,你解决问题的能力是由天赋决定的,但同时,只有一种方法可以提高:即练习、练习和练习。以后我们会回顾这一部分,但现在你只需要记住,你只能通过尝试来掌握一些东西。2.统计/机器学习阅读上述内容后,我似乎鄙视统计和机器学习。但在这里,我们不讨论一个强大的工具;它们非常复杂(在某种程度上是一个非常深奥的领域),如果你没有专业知识,你就不会很快解决数据科学问题。进一步解释这些词,机器学习可以被认为是从人工智能/计算科学和统计学中发展起来的多学科领域。它通常被认为是人工智能的一个子领域,这是正确的,但意识到没有统计学就没有机器学习是非常重要的(机器学习非常依赖统计算法)。长期以来,依赖统计学家一直被机器学习所鄙视,但这两个领域的合作创造了最近的发展(见统计学习理论)。顺便说一句,只有当统计学家与机器学习结果合作时,高维统计学习才能取得良好的效果。3.计算编程只需要一个简单的接触程序,因为它应该非常直观:但编程对数据科学家来说是必要的。想象一下,如果你不能编程,你如何通过编写一个独特的算法来实现你的理论?还是建立统计模型?并非所有的分布式计算都需要超大的数据组,但考虑到现代世界的情况,建议在工作中添加大数据。简而言之,单台计算机中的主要内存无法实现大数据处理。如果你想同时在数百台虚拟机中训练模型,你需要能够使用分布式计算和并行算法。对于A类数据科学来说,软件工程让我清楚地知道,工程是一门独立的学科。因此,如果这是你想成为的数据科学家类型,你实际上不需要成为一名工程师。然而,如果你想将机器学习算法转化为应用程序(即B类),你将需要一个强大的软件工程基础。数据清理/准备手动转换是数据科学的重要组成部分。这将花费你大部分时间。如果不成功降噪数据集(如错误赋值、非标准化分类等。),会影响建模的准确性,最终导致错误的结论。因此,如果你还没有准备好处理数据,这将使你以前的知识积累显得无关紧要。一个非常重要和值得注意的问题是,数据质量在商业组织中一直是一个有争议的话题。在数据存储方面,许多业务涉及复杂的基本事务需要处理。因此,如果你还没有准备好融入这个环境,想要处理纯数据集,商业数据科学可能不是最适合你的选择。到目前为止,你应该意识到,与其他所有条件相比,成为一名具有解决问题能力的数据科学家是首要任务:因为技术将继续改变,并且可以在相对较短的时间内掌握。然而,我们不能忽视其他影响因素。因此,认识到应用最广泛的工具对成为数据科学家是有用的。让我们从编程语言开始。R和Python是两种最常用的编程语言。因此,如果你能选择,我希望你能选择其中一种语言进行实验研究。特别是在A类数据科学领域,直观观察数据的能力将对与非技术商业股东的沟通产生重大影响。你可能有最好的模型和最深刻的见解,但如果你不能有效地呈现/解释这些研究成果,它会有什么用呢?事实上,通过使用R或Tableau(当时最流行的编程语言),你使用什么工具来实现数据的直观可视化并不重要,但说实话,工具并不重要。最后,无论我们讨论的是关系数据库,还是使用大数据技术获得的SQL衍生数据库,大多数公司都非常重视SQL,因为SQL是当时数据库中最广泛的编程语言。至少在处理较大的数据库时,SQL对手动转换数据尤为重要。总之,SQL真的值得你花一些时间研究应用。在商业数据科学领域工作的交流/商业头脑,具备交流能力/商业头脑不容忽视。除非你将从事一项非常具体的工作,否则它可能是一项纯粹的研究工作(尽管我们必须面对现实,但这种工作在行业中并不多)。绝大多数数据科学领域的工作都涉及到行业交流和互动,通常与非学者类型的人打交道。概念化商业化问题和催生这些问题的环境是极其重要的。将统计学的观点转化为公众推荐的行动或启发性观点也很重要,特别是在A类数据科学领域。我曾经和Yanir谈过这个话题。他的观点如下:“我发现了一个奇怪的现象。当一些技术人才开始用行话与人交流时,他们并不关注他们的对话者——那些非技术人才,他们的目光已经落到了别处。在交谈过程中,设身处地为他人着想是很重要的。摇滚明星乍一看,你可能会感到困惑:事实上,我用这个标题来暗示讽刺。当然,数据科学家不是摇滚明星、忍者、独角兽或任何其他神秘的生物。如果你打算把自己当成上面提到的任何一种生物,你可能应该对着镜子好好照顾自己。但是,说到这里,我离题了。我想表达的是,一些数据科学家有顶尖的专业水平,也可能有更高的专业水平。在别人眼里,稀有物种特别珍贵。如果你有这样的天赋或愿望成为其中一员,那就太棒了。然而,如果你没有这种天赋或愿望,请记住:你可能专门从事数据科学的某些领域,通常,一个好的团队是由精通不同专业领域的数据科学家组成的。我们将在下一章继续讨论我们的研究重点在哪个领域,这个问题将回到我们之前提到的个人兴趣和能力。第二章:自我分析现在正在进步!在成功地消化了第一章的内容后,你现在必须准备好开始设定你的个人目标。但是,我们首先要回顾一下——不妨来杯咖啡,找个安静的地方,深思以下问题:1。你为什么要成为数据科学家?2.对哪种类型的数据科学感兴趣?3.你有哪些天赋或相关技能?为什么认真思考这些问题很重要?简而言之,数据科学是一个专业的研究领域,所以从事这个领域的研究并不是一个容易的选择,除非你已经掌握了我们在第一章中提到的知识和技能。在这一点上,合理解决前两个问题尤为重要:你需要找到合理的理由从事数据科学领域的研究,否则,当遇到困难时,很容易放弃一半。为了详细说明以上观点,我们来听听DylanHog的见地。Dylan以前是软件工程师,现在是数据科学研究协会的领导者。数据科学研究协会使用机器学习(NLP)搭建雇主与相关候选人建立联系的平台。Dylan是如何成功地从软件工程师转变为数据科学家的(他仍处于转型期),我们将讨论转型过程中应该具备的条件,他说:“无论教育水平,经验丰富,有一些内在的事情尤为重要,即一个人的知识欲望、决心和毅力。你会遇到很多困难:可能是算法错误,也可能是技术瓶颈。无论你遇到什么困难,你都可以找到研究机器学习算法或软件工程的最佳方法,但如果你的信心不够坚定,你就会放弃或无法克服困难。“现在你会明白,在学习的过程中,你不仅会遇到困难;在工作和生活中,你会一个接一个地遇到问题,所以你最好确保有一个合理的理由来激励自己,而不仅仅是因为你认为拥有“科学家”的头衔有多酷。但是,我们应该如何处理第三个问题呢?为什么拥有相关技能很重要?是的,一个人的起点会影响你应该从自己感兴趣的领域学到的最合适的数据科学类型和知识?为了正确回答这个问题,有必要探索通往数据科学领域的典型途径,我们应该首先从更广泛的科学领域开始。注:在许多定量学科中,许多人都具备了向数据科学转型的素质。我不会在这里一一列举,但需要强调的是,如果你花时间真正理解每种类型数据科学之间的细微差异,无论你的知识背景如何,你都会意识到你的相关技能的重要性。其他科学不是数据科学领域最常见的道路;接下来,我们将讨论统计学和计算机科学在数据科学研究中的重要性。然而,许多领域的科学家都有熟练的相关技能(尤其是物理),许多人已经跳过了这方面。为了解释这一点,请允许我介绍澳大利亚联邦银行数据科学家WillHanninger。此前,Will是欧洲核研究中心的粒子物理学家,发现了希格斯玻色子。以下是他的语录:“在物理学领域,你可以自然地学习所需的数据科学知识:编程和操作数据,获取原始数据,并根据实用性转换数据。学习统计学知识,重要的是要学会解决问题的能力。这些都是数据科学家应该具备的基本技能。因此,技能组合具有很高的可转换性,最重要的是获得解决问题的能力。例如,虽然机器学习是数据科学的同义词,但这种同义关系在更广泛的科学中并不常见。在上述讨论中,我们一直在谈论高智商人才,他们有能力在短时间内学习使用工具和技术。以SeanFarell的科研经验为例。Sean的专业是天体物理,之后
以上就是关于为了闯入数据科学领域,他们需要做些什么?的相关介绍,更多为了闯入数据科学领域,他们需要做些什么?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对为了闯入数据科学领域,他们需要做些什么?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一