2021-01-05 13:55:18 阅读(194)
您希望找到一份数据科学家的工作吗?假如你有这样的想法,那么你就有了伴侣。最近,ThomasDavenport和Davent.J.Patil在《哈佛商业周刊》上发表了一篇专栏,称“数据科学家”是21世纪最性感的工作。那你怎样才能找到路呢?许多实用的资源可以帮助你成为数据科学家,但你需要全面控制软件开发、数据修改、数据库、统计学、机器学习和数据可视化等多个学科。请不要担心,根据我的经验,作为一名数据科学家,事实并没有那么沉重。你真的不需要花尽可能快的时间学习与数据相关的信息和技能。你需要做的是仔细阅读数据科学岗位职责的描述。这样,你就可以根据你现有的经验和技能申请与数据科学家职位相关的工作,或者根据特定职位的需要加强特定的数据技能,以便更好地匹配你想要的工作。“数据科学家”是四个数据科学岗位的综合岗位头衔,通常用来表明这个岗位与其他类别的岗位有很大的不同。以下是四个数据科学职位:数据科学家是住在旧金山的数据分析师。事实上,许多公司的数据科学家相当于数据分析师。你的日常工作可能包括以下几个方面,比如从MySQL数据库中提取数据,在Excel数据透视表中获取数据,生成基本的数据可视化图表(如条形或柱形图)。您也可能偶尔分析A/B测试结果,或负责公司在GoogleAnalytics注册的账户。这样的公司对于渴望成为数据科学家并想要触摸技巧的你来说确实是理想的地方。请放养我们的数据!似乎许多企业的信息流即将达到高峰(数据量不断增加)。企业正在寻找合适的候选人,建立大量的数据架构,使企业能够不断发展。他们也在寻找能够进行数据分析的合适候选人。您会在“数据科学家”和“数据工程师”的类别中发现这类岗位的公开招聘信息。既然你想成为公司第一个数据员工,仍然有一些容易获得的职位。这些职位的重要性没有数据科学家那么重要,比如统计师或机器学习专家。具有软件工程背景的数据科学家在公司中的表现可能更加突出。数据科学在公司中的重要作用是为产品代码做出贡献,并提供基本的洞察力和分析结果。但在这类企业中,基层数据科学家的员工不会有太多的师徒制机会。因此,在这种环境中,你可以在许多测试后发光发热,但这种环境也会缺乏相对的安全性,因为你将面临完全失败或停滞的风险。对于许多公司来说,我们是数据,数据就是我们自己的产品,他们的数据(或者他们的数据分析平台)。在这种情况下,公司的数据分析或机器学习环境非常激烈。这种环境可能非常适合那些有正式数学、统计或物理背景并希望在学术道路上继续深造的人。数据科学家更倾向于专注于生产更好的数据驱动产品,而不是回答公司的一些操作问题。这类公司可能是为消费者提供大量数据的企业,也可能是基于数据的专业服务。在这类企业中,规模适中、数据驱动的非数据企业,您的作用是参与其他数据科学家组成的团队合作。你申请的公司与数据有关,但实际上他不是一家数据公司。同样重要的是,您仍然需要能够执行分析、触摸产品代码、可视化数据等。通常,这类公司要么正在寻找综合性的多才多艺,要么正在为公司填补团队所缺乏的专业人才,如数据可视化或机器学习。当你参加这类公司的面试时,你的最终技能是熟悉使用专门为大数据设计的软件工具(如Hive或Pig),并在现实生活中处理那些糟糕的数据库。希望以上四个方面的信息能让你充分理解为什么一个“数据科学家”的头衔有如此广泛的含义。上述四家具有不同个性的公司对候选人的技能、经验和经验水平也有不同的要求。这样,所有的公开招聘工作都将被称为“数据科学家”,所以你必须仔细阅读工作职责,了解你将加入的团队,以及你可以提高什么技能。掌握8项技能,让你如鱼得水,以下是8项你应该发展的数据科学岗位技能:无论你申请什么样的基本工具,你都应该有了解如何使用交易工具的经验。比如R或Python等统计编程语言,SQL等数据库查询语言。作为数据科学家,基本统计学至少了解一种基本统计学是非常重要的。一位面试官曾经告诉我,他面试过的很多人都无法正确定义p值。因此,你必须知道统计测试、分布和最大的相似估计。试着回忆下面你的统计课!机器学习的问题与这种情况相同,但你的统计学知识最重要的方面是,你必须知道不同的技术方当时是有效的(或无效的)。统计学对各种类型的企业非常重要,但特别是对于那些以数据为驱动的企业,他们的产品不注重数据,产品利益相关者会根据您提供的帮助做出决策和设计/评估测试结果。如果您工作的企业有大量的数据资源,或者您的企业产品本身受数据驱动,您必须熟悉机器学习算法。这意味着你需要了解所有与机器学习相关的流行词汇,如k值临近法、随机森林、集成方法等。我们确实可以使用R或Python库执行许多技术,因为如果你不是行业专家,如何主导算法工作,你就不需要成为一个血腥的交易使者。最重要的是,你需要知道一般的框架,你需要知道在不同的时间使用相应的合适技术。多变量微积分和线性代数在面试时,面试官很可能会要求你导出一些机器学习或统计结果。即使你不问,面试官也会问你一些基本的多变量微积分或线性代数问题,因为它们是许多技术的基础。也许你想知道为什么数据科学家需要知道这些东西,如果我们有很多sklearn或R工具来帮助我们实现这些功能。因为在某种程度上,数据科学家团队值得在内部开发执行工具。对于在生产数据驱动产品的公司工作的人来说,理解这些概念是非常重要的,优化和改进预算执行或算法将为企业带来更多的成功。通常情况下,你分析的数据会变得极其凌乱,使你的工作极其困难。因此,有必要找出如何处理数据中的缺陷。常见的数据缺陷包括遗漏值和不一致的字符串格式(如“”NewYork”对“newyork”对“ny还有日期格式(2014-01-01vs."01/01/2014"等。作为一名较早进入企业的数据技术人才,数据修改是首要任务。无论您的公司规模很小,还是您所在企业生产的产品与数据无关,企业的发展都需要由数据驱动。拥有这种数据修改技能是非常重要的。数据可视化和信息交流数据的可视化和通信化非常重要,特别是对于第一次做出数据驱动决策的年轻企业,或者将数据科学家视为帮助他人做出数据驱动决策的企业。我们所谓的数据交流,是指无论是技术层面还是非技术层面,你向观众描述你的发现或技术效果的方式。如ggplot和d3等熟悉.像js这样的数据可视化工具对你有很大的帮助。软件工程不仅要了解数据可视化所需的工具,还要学会了解可视化数据编码和交流信息隐含的原理。如果你申请的单位很小,你也是公司最早申请的数据科学家之一。你最好有软件工程的专业背景。因为一开始你需要处理大量的数据日志文件和数据驱动产品的开发。像数据科学家一样,公司想看到你是一个问题的解决方案,在你被雇佣后(数据驱动)。也就是说,在你面试的某个时刻,你会被问到一些困难的问题。例如,企业想要运行测试方法或由数据驱动的产品。对你来说,你应该深入思考这个问题中哪些是重要的,哪些是不重要的。作为一名数据科学家,你应该如何有效地与相关工程师和产品经理互动?您应该采用什么方法?什么时候会发挥近似值的作用?数据科学仍然是一个不断受到批评的新领域。找到这样的工作就像找一家能与你的技能相匹配的公司的需求,因为它能让你的技能不断成长。这篇文章是在我个人实际经验的基础上写的。
以上就是关于如何入职4种数据科学工作岗位?的相关介绍,更多如何入职4种数据科学工作岗位?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对如何入职4种数据科学工作岗位?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一