2021-01-05 11:15:28 阅读(182)
最近,机器学习非常流行。我们还介绍了很多关于机器学习的知识。那么数据科学家在工作中通常会做些什么呢?让我们今天一起探索一下。首先,让我们通过两篇文章来了解数据科学家在工作日所做的事情。第一篇是《Airbnb支付平台如何进行异常检测》。英文原名AnomalyDetionforAirbnbsPaymentPlatform。这是关于Airbnb的数据科学家如何根据他们的知识建立一个实时的异常检测系统来监控他们的支付系统,从而帮助其他团队成员将精力花在刀刃上。另一篇文章是Twitter的Breakoutdetectioninthewild。由于Twitter的许多数据都是时序数据,文章讲述了如何检测某一时期的突发热点,以确保用户体验。从这两篇文章可以看出,数据科学家的许多工作都是为了维护产品的流畅性和用户体验。下面就让我们仔细看看他们的日常生活。顾名思义,数据科学家的日常仪表盘工作就是让人一眼就能看到所有想要的数据。找出关键指标,简化复杂联系,让领导一目了然地了解公司的相关事宜。想象一下,公司首席执行官每天早上需要五分钟来了解公司的运营情况。这里要呈现的是首席执行官仪表板。以酷我音乐为例。如果你想向首席执行官传输一个具有仪表板功能的数据,数据科学家可能需要整理每日用户数量、用户登录数量、付费用户比例、人均消费、流量转换率和流量价值,以便首席执行官可以在一段时间内对公司的方向有一个大致的了解。有了总体规划,数据科学家需要开始收集和整理数据。当然,第一步是埋点采集。例如,如果我们想收集某件事的流量状态,我们需要将数据埋在每个端口收集。有了生数据,后地工作就是清理噪音。一般来说,数据中会有一些干扰数据。例如,在做音乐推荐时,你需要不同用户喜欢的手机歌曲,但有些用户可能每天喜欢成千上万的歌曲,几乎再次点击他们听到的音乐。这些数据很难找到有用的特征,这对机器学习没有帮助,所以我们必须删除这些数据。最后是统计整理。这不仅需要计算数字,还需要从结果中选择最具代表性的数据。在获得可用数据后,调整模型可以开始寻找模型。当然,第一步是建模。现在有很多开源模型,选择合适的模型。选择模型并不难,但选择合适的模型需要很大的努力,所以数据科学家需要分析结果来判断。中间可能需要准备一些高质量的训练集来测试模型效果。如果我们选择模型,我们可以开始调整模型的参数。调整参数分为两部分对准,另一部分对准性能。调整性能是个体力劳动。有时考虑使用多样化的数据进行调整。A顾名思义,/B测试AB测试是将用户分组,然后分别测试和收集,最后进行分析和决策。例如,当我们测试一些新广告时,我们可以立即选择一些用户,为用户播放一系列广告,并根据用户的活动范围猜测哪些广告效果好。这样可以大大优化测试效率。一个好的AB测试可以大大缩短评估时间,在短时间内给出更好的反馈。以上四个方向是大多数数据科学家的基本工作。它们可以做一个方面,也可以做多个方向。现在的趋势是团队合作比较多。来自哪里的数据科学家?从专业角度看,数据科学家来自各种专业,包括统计、统计、机械、金融、数学等。这些专业都有一个共同点,那就是对数学知识的要求比较高。从文凭的角度来看,硕士和博士学位的比例明显相对较大。许多人认为这个行业是一个门槛很高的行业,但事实并非如此。从下图来看,数据科学家有很多方向。有的对数学要求高,有的对编程要求高,有的需要你是全才。只要你能把其中一个方向做好,你就会有一个数据科学家的素质。优秀的数据科学家是什么样的数据科学家?在这里,我们将其分为四个敏感性:对数据足够敏感的沟通,将概念传达给他人的可视性,并将数据可视化表达给他人。分析正确的结果,朋友们可能会发现,以上特点也符合一个好的产品经理的特点。事实上,这是真的。大多数时候,数据科学家必须找到问题的来源,收集自己的数据,然后提出产品优化方案来改进产品。另一方面,一个好的产品经理往往是一个好的数据科学家。需要提醒的是,虽然现在人们喜欢用大数据来解释很多事情,但如果过于依赖量化分析,很容易走错路。Zynga曾经很受欢迎的公司的衰落或多或少与过度依赖数据分析有关。因此,一个好的数据科学家除了能找到好的数据外,还需要有可靠的解释技能。总结仪表盘,采集清算,调整模型,A/B测试敏感沟通,可视分析每个人都是数据科学家
以上就是关于数据科学家上班都做些什么?的相关介绍,更多数据科学家上班都做些什么?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据科学家上班都做些什么?有更深的了解和认识。
推荐阅读
最新文章
猜你喜欢以下内容:
一 客户顾问-张三 一