2021-01-07 11:53:46 阅读(194)
数据科学家的困惑主要归咎于数据科学不是一个特定的职位,而是一种解决机构问题的方法。因此,数据科学可以包括各种教育背景、技能、工具和实践。数据科学家在实际工作中,背景和技能跨度很大,很难一概而论。描述什么样的数据科学实践相对容易。简单地说,数据科学是用数据主导的答案来解决实际问题的实践。实现这一目标的技术可能有很多种。在传统统计学、贝叶斯方法、机器学习、计算工具、行业知识等方面,你会经常听到数据科学家回答问题。有时数据的规模会很大,需要使用复杂的工具和方法来通过雾来得出隐藏在数据中的清晰结论。但是没有办法、工作、算法来回答所有的问题,所以也很难为数据科学家定义。展示可能比陈述更有说服力。让我们走进数据科学家平凡而不平凡的一天。早晨的第一件事可能是这一天日程中为数不多的惯例之一。我们的团队在早上举行例会,分享前一天的进展和问题。这可能与软件开发的“站立”会议有点不同。对我们来说,“进步”不仅可以构建一些软件,还可以阅读一篇能让我们对手头的问题有更深刻理解的论文。在许多方面,数据科学可能不同于大学的学术行为,但它仍然是科学方法的合理应用。通常,我们的挑战是如何将“未知”变成“已知”。不仅如此,还要让它“可执行”。这意味着通过分析数据来检验假设,建立测量效果的方法,迭代这个过程,直到最终的研究结果被纠正到足够有用的水平。晨会是交流各种实验进展的机会。现在我们早上有了自己的任务。是时候做一些实际的工作了。这是一天中最有趣的部分。那是我坐下来专注于一个实际问题的时候。这可能意味着研究处理偶图的方法,或者写一些代码来计算高斯超几何函数。但每周面临的问题很少相同。数学、统计和编程的背景对解决这些问题非常重要,但仍然不够。不可能成为各种方法的专家。无法预测下一个问题需要什么知识。这就是为什么数据科学家需要不断学习和无限的好奇心。在大多数情况下,每个新问题都需要一种新的方法。这些方法不仅对你来说是新的,对整个世界也是新的。这是数据科学的挑战和刺激来源。不确定性不仅是统计学的属性,也是生活方式。中午数据科学的实践不仅仅是应用某些算法的技术细节,还有在白板上写出深刻的算法。归根结底,我们需要解决现实生活中的问题。这意味着理解别人面临的问题。中午是与全面了解我们客户和合作伙伴每天面临的任何问题的客户、业务发展部门、服务部门和人见面的好时机。如果不能为他人创造便利,大数据分析和机器学习的力量就没有多大意义。这是数据科学中一个重要但经常被忽视的步骤。它决定了一个项目的最终成败。这也是区分数据科学和传统学术的一点。将业务问题翻译成仔细的研究项目,然后将研究结果翻译成实际的解决方案,需要对业务的深入了解和大量的创造力。闭门造车,无休止地做算法调优的数据科学团队永远不会成功。的确,有时候需要这样做才能最终交付一个项目。但是,如果这些数据不能投入实际应用,有什么意义呢?数据可以告诉我们,世界知识和数据本身之间存在差距。弥补这一差距的唯一途径就是与一线工作人员保持良好的沟通关系。下午,我们卷起袖子,从技术和实践层面研究问题。是时候退一步思考全局了。我们经常在下午花点时间详细讨论一个项目的目标,或者讨论把一个研究项目变成可交付形式所需的剩余步骤。与产品团队的密切沟通可以保证我们的工作与组织的总体愿景/目标一致。确保专注于关键问题是非常重要的。因为我们的工作是解决问题,所以我们必须确保解决方案是有效的。我的意思是,在实际工作中是可行的。根据特定业务提供解决方案只是一个开始。我们需要建立一个可靠的、可重复使用的工具。这不仅包括将测试推广到更实用的案例中,还包括构建一个能够深入产品的解决方案。这个链接是我们最像软件开发人员的部分,考虑并编写一些测试来确保性能、稳定性和可扩展性。我们负责在Umbel的软件工程团队中建立一个宏大的系统,我们不能给他们额外的工作,让他们为我们清理混乱。把这些测试变成软件的唯一方法就是在项目的整个过程中思考这个目标。这就是为什么数学不应该仅仅包含在研究阶段。我们需要知道,我们不仅可以解决某个问题,还可以在实际限制下构造软件来解决这个问题。在经历了这一天之后,有必要深吸一口气,看看你走了多远。有些日子比其他日子走得更远。大多数测试以失败告终。大多数解决方案需要在最终显示之前进行调整和抛光。很少有人能保证你选择的路线是正确的。开辟天地的过程总是伴随着不确定性。但是每天在这个过程中,你都会学到新的东西。在这一天的最后,我们反思了我们学到了什么,并把这个关于世界的新知识带到了明天的晨会上。经过足够的努力,我们终于得到了针对特定问题的直接可行的答案。由于数据严格支持,我们可以对这个答案充满信心。此时,我们仍然没有完成代码的编写。正如我之前所说,数据科学项目的一个关键环节是将最终结果翻译成有意义和实用的东西。我们需要有效地向不同背景的观众传达我们所学到的东西。最后,我们需要用数据讲一个故事。和其他环节一样,这个环节没有唯一正确的方法。在这个链接中,我们寻找使用图表可视化结果的方法,或者在一个平面上显示从问题到答案的每个链接,或者只是宣布“好的,我们需要做的就是这样。”“这里的关键在于,在最后,每个人都能理解该做什么,为什么要这样做。你可能在网上看到过展示数据科学家需要多少种交叉技能的图片。他们会告诉你,数据科学家是一个天生就是数学家的软件工程师,或者是一个MBA,喜欢在周末用咖啡量制作的精美可视化项目。希望这位数据科学家的日常讨论能让你明白这些图片是怎么来的。但数据科学并不是对某种工作的描述,而是一个过程。的确,你需要上面提到的技能,甚至更多的技能来成功地实现一个数据科学项目。但是,不要认为你需要一个人完成一切。数据科学,就像任何其它复杂的努力一样,是一种团队合作。这就是为什么你很少看到两个具有相同简历的数据科学家。一支优秀的数据科学团队应该包括所有这些技能,拥有专家和通才,每个成员都有强烈的好奇心。如果数据科学家必须擅长某件事,那就是学习。
以上就是关于什么样的数据科学实践更容易?的相关介绍,更多什么样的数据科学实践更容易?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对什么样的数据科学实践更容易?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一

