首页 >知识讲堂 >数据分析知识>数据分析方法论有效性的评判关键是什么?

数据分析方法论有效性的评判关键是什么?

2021-01-11 10:25:24 阅读(204 评论(0)

1、在数据集成项目中,最困难的过程是数据分析。数据分析过程位于数据集成项目的整个过程(准备早期研究)—–数据分析—–界面实现)的第二步为第三步界面实现提供了充分的准备,因此数据分析的正确性在很大程度上决定了数据集成的成功实现和完成。如何有效地进行数据分析,如何提前在数据分析中尽量避免出现问题,直到实现为止?这是判断数据分析方法论有效的关键。经过几个项目的经验,我反思了做这些项目时更有效的方法和错误的方法,总结了一套我认为可行的数据分析方法。该数据分析方法仅适用于数据库-文件-数据库或数据库-数据库的分析,以及接口集成(如调用对方的webservice、EJB接口等。)不适用,在这种数据分析方法中,指导数据分析的步骤和需要注意的问题,编写这个blog,希望有同行的同学多交流。2、数据分析方法论中涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可以是数据库或文件。2、该方法所涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可能是数据库或文件。源数据源是指在数据集成中获取数据的数据源,可能是数据库或文件。字典代码以代码的形式存储在数据库中(如数字、英文字母等)。)而不是中文意思,这些代码称为字典代码。2.1.步骤2.1.1.分析目标数据源数据结构目标数据源可能是数据库或文件,但无论如何,它都有数据结构,首先要做的是分析目标数据源数据结构,在分析目标数据源数据结构时,分析清楚:表目标数据源需要交换什么表,这些表的含义是什么。这些表中包含的字段、字段类型和长度。分析每个字段的含义,包括字段的中文含义、字段所涉及的字典代码和字段规则(如业务规则、生成规则)。在分析了上述表、字段和字段的含义后,形成了以下结构的文档:字典代码字段规则idnumber(10)主键流量-流量,unitcodevarchar2(19)单位编码字典-2.1.2.完成第一步后,分析目标数据源的表关系,然后分析目标数据源的表关系。分析表关系最重要的是分析每个表之间的关联关系(如一对一、一对多、主键和外键),其次,需要根据业务分析每个表之间的隐性关联,例如,只有当A表中的某个值为03时,才与B表相关。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.数据源分析的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.1中的文档。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.分析源数据源的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.文档1.2.1.4.分析源数据源的表关系方法与2.1相同.2.分析对象改为源数据源,分析后形成相同的2.1.2中的Rose图。2.1.5.根据目标数据源的表关系,根据目标数据源的表关系,分析其与源数据源表的对应关系。在这一步中,我们需要清楚地分析目标数据源的表数据来自源数据源,以及如何获取这些数据,分析后,可以形成一个标准来验证数据集成是否正确,也就是说,目标数据源的数据量应该与来源数据源的数据量一致。在分析过程中,仍然根据目标表的业务意义在源数据源的表中找到具有相同意义的表。在分析过程中,可能会遇到以下情况:意义相同的表通常使用一个表存储目标数据源和源数据源,意义相同的表通常是一对一的数据关系,例如,目标数据源中有一个表是常住人口的基本信息,源数据源中有一个常住人员的基本信息,两个表可以对应。当然,有时意义不一定相同,这需要从业务层面来判断。在这种情况下,目标数据源通常是一个表,源数据源是多个表。此时,形成多对一关系。例如,目标数据源中有一个表是项目表,源数据源中有几个表,如手机和证券。此时,您需要将手机和证券表对应于项目表。或者可能会遇到这样的现象,目标数据源是一个表,源数据源也是一个表,但源数据源每行记录包含两种类型的目标表记录,在这种情况下需要将源数据源记录分成两个进入目标表,如目标数据源是迁出表,其存储模式是单独记录存储,源数据源也是迁出表,但是,它的存储方式是在同一条记录中进行迁出和迁出。此时,将源数据源的迁出表的一行记录分为两条进行导入。具有包含意义的表与具有包含意义的表相反。含义表与上述含义表相反。根据业务的对应关系,这是最复杂的。例如,可能会遇到这样的现象。当源数据源中表的一个字段的值为多个时,需要将其分成两个记录并导入到目标表中。综上所述,目标数据源表和源数据源表可能存在一对一、一对多、多对一、多对多、条件对应几种关系,分析后形成以下文档:目标数据源数据源验证标准AAAA.数据量==A.数据量(变化(新增、编辑、删除)BB CB.数据量==B.数据量 C.数据量C DDC.数据量 D.数据量=D.数据量 C.数据量=D.数据量(D.wplx=’03’)D.数据量=D.数据量(D.wplx=’05’)EEE.数据量=E.数据量*2FFF.数据量=F.数据量/2(F.qrsj=F.qcsj)GGG.数据量=G.数据量 G.数据量(G.name包含,的总数-1)2.1.6.根据表的对应关系分析字段的对应关系和转换规则,根据表的单一对应关系(如目标数据源的B表对应源数据源的B表)、C表需要分为B对应B和B对应C两个步骤进行分析)来分析每个表中字段的对应关系和转换规则,相应的方法是:首先在相应的表中找到相应的字段,如果找不到相应的字段,需要从业务意义的角度推测字段是否需要合并多个字段或拆分字段,或根据某些业务规则生成字段的值。找到相应的字段后,首先根据类型和长度分析是否需要处理类型和长度,然后分析是否通过与其他表相关的字段获得,然后分析字段是否涉及字典代码。如果涉及,则需要比较两侧的字典代码是否一致,如果不一致,则需要形成两侧字典代码的对应关系,最后分析字段是否涉及业务意义,如果涉及,应注明如何处理。分析完成后,形成以下文档:idnumber(10)表名字段类型及长度源数据源字段类型及长度转换规则.idnumber(10)unitcodevarchar2(19).xzqh 表名.unitvarchar2(8) varchar2(20)单位代码字典映射contentvarchar2(100)Substr(表名.content,0,50、Varchar2(100)ifmonthVarchar2(1)If(表名.createdate.月份==系统时间的月份) Return‘1’;ElseReturn‘2’.unitnameVarchar2(100)UnitNames.unitNameVarchar2(100)表名.xzqh 表名.unit=UnitNames.UnitCode2.2.需要注意的问题是,数据集成是系统中最重要的基础,因此,在进行数据集成时,特别需要仔细考虑不会对数据产生破坏性影响,这也是数据分析过程中需要仔细考虑的问题。2.2.1.在进行数据分析时,需要考虑数据覆盖/混乱的问题,以便在集成数据后是否会非法覆盖或混淆现有数据。这个问题通常是由主键引起的,在进行数据分析时需要考虑。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.3.源数据源数据质量问题的解决方案需要考虑如何处理或避免源数据源本身的数据质量问题。2.2.4.在整个数据分析过程中,业务专家的支持可以看出,业务专家起着非常重要的作用。可以说,如果没有业务专家,数据分析很可能会失败,或者需要走很多弯路才能最终探索。可以肯定的是,在业务专家的支持下,整个数据分析过程将大大延长。从这个角度可以看出,在进行数据分析时,尽量得到业务专家的支持。3、总结上述方法对数据分析的过程和避免问题的方法进行了一定的描述。在实际的数据分析中,最重要的是负责数据分析的人对系统的理解。有系统设计经验的人成功进行数据分析的概率要高得多。一些非常专业的系统必须依靠有相应设计经验的人才来完成,比如流程系统的数据集成。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。方法论仍然是理论。我不是一个那么讲理论的人,但我不否认理论对实践有很好的指导作用。最好避免在实践过程中走太多弯路,将理论与实践相结合。理论指导实践,实践改进理论。

以上就是关于数据分析方法论有效性的评判关键是什么?的相关介绍,更多数据分析方法论有效性的评判关键是什么?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据分析方法论有效性的评判关键是什么?有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

怎么制作公司定位

  企业地图定位怎么弄?  1、进入地图APP界面,选择“个人头像”。  2、进入个人信息界面,选择“常用地址”。  3、进入帐号登录界面,可以选择“跳过”不用登录。  4、进入添加地址界面,选择“公司”。  5、进入地址添…查看详情

printf和scanf的区别

printf与scarf变量使用有什么区别?printf和scanf都是c语言标准库中常用到的函数。最主要在于功能使用上有所不同。scanf、printf函数被声明在头文件stdio.h里。scanf是格式输入函数,即从键盘上把数据输入到指...查看详情

万商云集2019年度品牌服务大使新鲜出炉!

Ohmygod!原来是他们!1月15日晚,万商云集2019年度品牌服务大使投票竞选截止,有三名候选人凭借着超高的人气斩获前三甲,获得年度品牌服务大使的殊荣。他们都是万商云集专业客户代表“可盐可甜”“颜值高”“稳重成熟”是朋友、家人为…查看详情

理发店收银系统怎么弄?适合理发店的收银系统推荐

在理发店中,不管是大规模连锁,还是小规模经营,使用一款美发店收银软件都将为商店带来无形的价值,在满足基本的收银功能的同时,对店内信息查漏补缺,引进更多客流量,那么理发店收银系统怎么弄呢?本文为大家推荐6款示范性的理…查看详情

如何写好互联网运营方案

首先提出一个问题,互联网运营方案写的是什么?要写出一份满意的方案,首先要明白运营方案是什么。互联网运营方案是指导一线员工甚至包含领导阶层实现某个阶段的战略性目标的文案,为了完成这个战略性目标,方案需要包含多个战略…查看详情

新使命·新应用·新业态 万商云集受邀出席中文域名创新应用论坛

4月24日,第二届中文域名创新应用论坛在京召开。万商云集受邀出席此次论坛会议,并与各相关行业精英展开深入讨论、分享行业经验。十九大报告多次提及实施网络强国战略。域名系统处于网络安全的关键环节,是互联网的中枢神经系统,…查看详情

网站建设的基本步骤

在互联网时代,相信网站对于企业的发展大家都是有目共睹的,因此网站成为了现代企业经营中必不可少的组成部分。虽然网站的重要性大家都了解,但是说到网站建设的流程就有些人不太明白了,今天小万就来把网络建设的步骤向大家简单…查看详情

淘宝CRM是什么意思,该如何去运营?

在这个网购满天飞的时代里,人人都在网购,那么作为网购平台的之一的淘宝是如何做好客户管理呢?相信淘宝上生存好多年的小伙伴们来说,应该都知道淘宝CRM,但是对于淘宝新手呢,他们就不知道什么是淘宝CRM了,会有疑惑,不就是自己…查看详情

商家注册商标要尽早办理,晚一天注册失败的风险就高一点

商家在生产经营过程中要想使用商标、保护商标,就需要注册商标。因为只有商家注册商标后使用,才能有效避免自己侵权和他人不侵犯自己权益。 图片来源于网络 商家注册商标是为更好地保护商标、保护自己的权益,所以应尽早办…查看详情

为什么微博不能评论(解决办法如下)

为什么微博评论好友看不到?为什么我评论别人的微博别人看不到1.就是你的微博账号的昵称或者简介里面有违规的内容,比如简介留微信号,这是大部分人都是会遇到的问题。还有头像、昵称等,有违规信息的,评论了之后都不出现的。2.你的账号…查看详情

flv格式文件如何播放

flv格式的视频用手机怎么播放?一般是可以的。  因为目前的FLV格式,基本上都是采用了h.264的编码,而现在的MP4,也是同样的编码。  也就是说,目前的FLV和MP4其实是一回事,只是封装格式不同,参数不同而已,解码器是完全一样的。 ...查看详情

免费的聊天软件有哪些 聊天软件排行榜

  现在市面上聊天软件是非常的多的,是非常五花八门的,。今天就来介绍免费的聊天软件有哪些 聊天软件排行榜这一块的相关内容。希望下面推荐的信息大家能喜欢。  聊天软件排行榜  一、微信  微信(WeChat)是腾讯公司于20…查看详情

专精特新企业认定标准是什么

  作为一个新的企业,想获得专精特新企业认定,对于企业的发展和市场竞争都有着非常重要的意义。那么,专精特新企业认定标准是什么呢?本文将详细描述这一问题,内容涵盖企业的几个方面。  1.企业注册时间  针对于新的企业来…查看详情

怎样挑选软件开公司

很多企业用的软件都是外包给第三方软件公司开发的,只有实力雄厚的企业可能会自己开发,但是大部分的企业还是选择外包这种软件开发方式的。但是外包软件成功与否也跟外包软件公司有着很大的关系,如果挑选的软件外包公司不好,后…查看详情

方便随时使用的3款手机电子词典

对于学习这方面,我们需要通过各种方式来巩固自己的基础知识,因为不管学哪些东西,基础知识都是非常重要的,如果你的基础不扎实,那么,每学一样新东西就会比较困难,手机电子词典有什么?1、eudic安卓手机系统上实用的离线词典APP…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询