首页 >知识讲堂 >数据分析知识>“数据科学”的演化及应用

“数据科学”的演化及应用

2021-01-06 13:50:31 阅读(144 评论(0)

数据科学家如何变得性感的故事,大致就是统计学作为一门成熟学科如何与新兴学科的计算机科学发生关系的故事。“数据科学”这个术语出现较晚,用来指代一个需要解释大量数据的职业。但数据的解读历史悠久,多年来一直被科学家、统计学家、图书馆员、计算机科学家和其他人讨论。以下时间线可以追溯到“数据科学”一词的演变,以及它的应用、定义它的尝试和一些相关术语。1962年Johnw.Tukey在数据分析的未来(”TheFutureofDataAnalysis)写道:“长期以来,我以为自己是统计学家,对从特例中得到关于整体的推断感兴趣。但当我目睹了数学统计学的发展时,我产生了猜测和怀疑。。。我开始觉得我的基本兴趣在于数据分析。。。数据分析和一些相关的统计学必须承担更多的科学特征,而不是数学特征。。。数据分析本质上是一门经验科学。。。预设程序的电子计算机。。它有多重要?在许多情况下,答案令人惊讶:重要但不重要,计算机在其他情况下无疑是至关重要的。1947年,Tukey创造了“比特”(bit)“这个术语在1948年被Claudeshanonused用于“传播数学理论”(”AMathematicalTheoryofCommunications)一文中。Tukey于1977年出版了《探索性数据分析》(ExploratoryDataAnalysis),他在书中提出,我们应该更加关注使用数据来提出哪些假设需要测试的建议,以及探索性数据分析和论证性数据分析“能够并驾齐驱”。1974年,Peternaur在瑞典和美国出版了《计算机方法简要调查》(ConciseSurveyofComputerMethods)。这是一项关于当时使用的数据处理方法的调查,包括许多应用程序。本书遵循国际信息处理联合会的数据处理概念和术语指南(IFIPGuidetoConceptsandTermsinDataProcessing)“数据”的定义:“(数据是)必须能够以某种形式传播或操作事实或想法的标准化表现。根据这本书的前言,国际信息处理联合会于1968年展示了一份题为“数据学:数据处理的科学及其在教育中的地位”的课程计划。Naur为数据科学提供了以下定义:“数据形成后,处理数据的科学。数据与它所代表的东西之间的关系属于其他领域和科学范畴。1977年,国际统计联合会(TheInternationalAssociationforStatisticalComputing(IASC))作为国际统计研究院(ISI)成立了一个分支。“国际统计联合会的任务是将传统的统计方法、现代计算机技术与各领域专家的知识联系起来,将数据转化为信息和知识。“GregoryPiatetsky-Shapiro于1989年组织并主持了第一次数据库知识发现(KnowledgeDiscoveryinDatabases(KDD))研讨会。1995年成为国际计算机年会知识发现和数据挖掘的SIGKDD会议。1994年9月,《商业周刊》发表了一篇关于“数据库营销”的商业报道:“企业收集了大量关于你的信息,并将这些知识提炼成营销信息,准确地瞄准你。。。20世纪80年代扫描码器的繁荣在广泛的失望中结束:许多公司被总数据淹没,但无法获得有用的信息。。。然而,许多公司认为,他们别无选择,只能勇敢地站在数据库营销的前线。1996年国际分类协会联盟(InternationalFederationofClassificationSocieties(IFCS))双年会在日本神户举行。“数据科学”一词首次包含在会议标题中(“数据科学、分类等相关方法”)。联盟由六个国家/语言分类组织于1985年成立,其中一个是“分类协会”(TheClassificationSociety)成立于1964年。这些分类协会在其出版物中大量使用数据分析、数据挖掘、数据科学等术语。UsamaFayy1996年、GregoryPiatetsky-Shapiro、Padhraicsmyth出版了《从数据挖掘到数据库的知识发现》(FromDataMiningtoKnowledgeDiscoveryinDatabases”)。他们写道:“在过去,从数据中寻找有用的模式被赋予了许多名称,包括数据挖掘、知识提取、信息发现、信息收获、数据考古学和数据模式处理。KDD(数据库中的知识发现)是指从数据中获取有用知识的整个过程,而数据挖掘是指具体的环节之一。数据挖掘是利用特定算法从数据中提取的模式...KDD过程中的其他步骤,如数据准备、数据选择、数据清洗、与合适的已知识相结合、对挖掘结果的正确解读,对于确保从数据中获得有用的知识非常重要。数据挖掘方法的盲目应用(统计文献中被批评为“数据挖泥”(datadredging))可能是危险的,会得到无用的发现和无效的模式。”1997年C.F.密歇根大学统计系HeffWu教授(现在在乔治亚理工大学工作).C.在就职典礼上,Carver主席提出统计学应重命名为数据科学,统计学家应重命名为数据科学家。1997年《数据挖掘与知识发现》(DataMiningandKnowledgeDiscovery)期刊发行。这两个术语的顺序意味着“数据挖掘”地位的上升,并成为描述“从大数据库中提取信息”的一种更流行的方式。1999年12月,沃顿商学院Knowledge@Wharton的《从数据中挖掘知识的金块》引用了JacobZahavi的说法:“传统的统计方法在小数据集上工作得很好。但今天的数据库有数百万行和大量列……可扩展性已经成为数据挖掘的一个大问题。另一个技术挑战是开发一个模型,可以更好地分析数据,发现非线性关系和元素之间的联系……网站决策可能需要特殊的数据挖掘工具。WilliamS2001年.Cleveland出版了《数据科学:扩展统计技术领域的行动计划》(“DataScience:AnActionPlanforExpandingtheTechnicalAreasoftheFieldofStatistics”)。该计划“扩大统计领域技术工作的主要领域。雄心勃勃的计划包含了本质的变化。变化后的领域被称为“数据科学”。“Cleveland在计算机科学和当代数据挖掘工作中定位了这一新领域:“……数据分析师的收入有限。由于计算机科学家思考和分析数据的方法有限,统计学家对计算环境的知识有限。知识的融合将带来巨大的生产力创新。这意味着统计学家应该更加关注知识的计算,就像过去数据科学关注数学一样。数据科学系应该由致力于改进数据计算的成员和与计算机科学家合作的成员组成。2001年,LeoBreiman出版了《统计建模:两种文化》(“StatisticalModeling:TheTwoCultures”):在使用统计模型从数据中提取结论的过程中,有两种文化。假设数据是由特定的分布模型生成的。另一种是使用算法模型,并将数据结构视为未知。统计学界普遍致力于只使用数据模型。这种投资产生了毫无意义的理论和可疑的结论,使统计学家无法触及许多实际问题。在理论和实践中,算法模型在统计学之外发展迅速。它不仅可以应用于庞大而复杂的数据集,还可以在小数据集上建立大量准确信息的模型。如果我们的目标是使用数据来解决问题,那么我们需要摆脱对纯基于数据模型的依赖,并使用更多样化的工具。”

以上就是关于“数据科学”的演化及应用的相关介绍,更多“数据科学”的演化及应用相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对“数据科学”的演化及应用有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

网站最怕置于一旁不更新,网站维护与运营才能被用户看到

建设网站不是完成就放置一旁,等用户自己来、自己看、自己买,或是每天发发文章,保证网站能打开就行。网站维护与运营在很多时候比网站建设还要重要,但它却总是容易被忽略掉。 图片来源于网络 网站维护与运营,是定期或不…查看详情

怎样学好c语言

如何学习C语言?1、课前预习,课后复习,认真做课堂、课后的作业,理解理论知识。2、记住语法规则。3、加强逻辑思维。4、多动手,通过练习上机了解它的运行过程。5、实践—>理论—>再实践,刚开始学习C语言时,按示例练习,并推动…查看详情

这三款订货系统软件货源齐全,你想要都能找到

对于超市和便利店来说,当她们的库存没有多少之后,就会再次进货,那么,进货的渠道有很多,现在又是网络的时代,因此,大多数人会选择从网上进货,这样比较方便,那么,订货系统软件有哪些?1、新商盟订货系统是中烟新商盟公布的…查看详情

好看的欧美校园电影有哪些 欧美校园电影排行榜

  现在也有很多的欧美经典电视剧值得大家观看,再者在这一类的欧美电影中还有校园电影这一类的题材,下面小编就给大家来详细介绍一下好看的欧美校园电影有哪些 欧美校园电影排行榜这一块的相关内容。希望大家喜欢下面推荐的…查看详情

excel如何建立数据库

excel数据库的建立步骤?1、打开access2、点击空白数据库3、命名你的数据库4、点击外部数据5、点击数据来源6、点击文档7、点击excel8、选择你的表格,完成就可以了EXcel创建数据库攻略?在数据处理之前,我们必须建立有限的数据...查看详情

怎么写出吸睛的服装店铺介绍?看看这篇文章

随着互联网和电子商务的发展,各个网络平台上的服装店铺也越来越多。随之而来的问题就是要打造店铺形象,那么服装店铺介绍就是其中很重要的一环。下面小编就来给大家整理一些关于服装店铺介绍如何来写的内容。 首先看你的服装…查看详情

vcf是什么格式的文件

vcf是什么格式?VCF格式,该文件格式是WINDOWS视窗系统"通讯薄"用户的存储格式。您可以点击"开始-所有程序-附件-通讯薄"将所有VCF文件导入其中,或者直接拖拽到OutlookExpress...查看详情

ai全自动剪辑软件,再也不必苦恼剪不出精美的视频

随着人民生活水平的不断提高,娱乐产业发展较为迅速,各种短视频平台也如雨后春笋般涌现,ai视频剪辑领域竞争压力逐渐增大。但是也不必苦恼如何剪辑出精美的视频,就让我来告诉你ai全自动剪辑软件有哪些:1.必剪必剪是一款很多人都…查看详情

htmlcss网页设计

怎么动态创建.html文件?以最简单的新闻网页为例,先是做一个模板页,假定其中3个地方要动态更换的:标题,内容,日期,哪么模板中这3个地方都要用特殊的名称表示。要生成html页时,先读入html模板页,再查询数据库,把查询到标题,内容…查看详情

获取商标注册情况:自行处理或代理,网上或大厅操作

商标注册前要获取的商标注册情况是,是否有和已注册商标相似或相同;商标注册中要获取的商标注册情况是它的状态,目前审核所处阶段;商标注册后要获取的商标注册情况是,商标注册信息,包括注册人、注册号、申请时间等。目前获取…查看详情

2021WMS仓库系统软件权威排名

WMS软件排名是怎样的?WMS系统能帮助企业实现智能化仓库管理,所有数据自动采集并更新到系统中,从而记录每一环节的数据和信息,从货品验收入库开始到出库发货整个环节流程,环环紧扣,形成完成追溯链条。所以今天给大家介绍2021WMS仓…查看详情

模拟定位软件哪个好用呢?

需求都是不断产生的,随着互联网的发展,很多人可能会在生活中需要用到模拟定位,这就需要一些手机模拟定位软件啦,但是很多人可能并不了解,以下是我给大家推荐的模拟定位软件。1.神行者是针对Android平台而开发的一款安卓虚拟定位…查看详情

网络推广哪里好?传播广泛、用户精准、数据反馈

网络推广是通过各种免费或付费渠道将商品或服务展示给他人的一种推广方式,要说网络推广哪里好,可用六个字概括:小投入大回报。企业可以利用互联网大范围地进行宣传推广,而从中获取利益。 图片来源于网络 网络推广哪里好…查看详情

电脑系统有哪些 常用电脑系统盘点

  目前的PC系统主要可以分为五类:Windows系统,NetWare系统,Linux系统和MacOS系统,可能很多人接触比较多的就是Windows系统,下面小编就给大家来详细介绍一下电脑系统有哪些 常用电脑系统盘点这一块的内容,...查看详情

免费的杀毒软件有哪些 好用免费的杀毒软件推荐

  信息安全是信息技术市场里面最有活力的部分,过去反病毒软件曾经是市场投资者的首选。很多人习惯性觉得互联网充斥着众多病毒,需要一道强有力的屏障以保安全。下面万商云集小编就给大家来推荐一下免费的杀毒软件有哪些 好…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询