首页 >知识讲堂 >数据分析知识>数据分析方法论有效性的评判关键是什么?

数据分析方法论有效性的评判关键是什么?

2021-01-11 10:25:24 阅读(227 评论(0)

1、在数据集成项目中,最困难的过程是数据分析。数据分析过程位于数据集成项目的整个过程(准备早期研究)—–数据分析—–界面实现)的第二步为第三步界面实现提供了充分的准备,因此数据分析的正确性在很大程度上决定了数据集成的成功实现和完成。如何有效地进行数据分析,如何提前在数据分析中尽量避免出现问题,直到实现为止?这是判断数据分析方法论有效的关键。经过几个项目的经验,我反思了做这些项目时更有效的方法和错误的方法,总结了一套我认为可行的数据分析方法。该数据分析方法仅适用于数据库-文件-数据库或数据库-数据库的分析,以及接口集成(如调用对方的webservice、EJB接口等。)不适用,在这种数据分析方法中,指导数据分析的步骤和需要注意的问题,编写这个blog,希望有同行的同学多交流。2、数据分析方法论中涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可以是数据库或文件。2、该方法所涉及的术语的解释:目标数据源是指需要在数据集成中导入数据的数据源,可能是数据库或文件。源数据源是指在数据集成中获取数据的数据源,可能是数据库或文件。字典代码以代码的形式存储在数据库中(如数字、英文字母等)。)而不是中文意思,这些代码称为字典代码。2.1.步骤2.1.1.分析目标数据源数据结构目标数据源可能是数据库或文件,但无论如何,它都有数据结构,首先要做的是分析目标数据源数据结构,在分析目标数据源数据结构时,分析清楚:表目标数据源需要交换什么表,这些表的含义是什么。这些表中包含的字段、字段类型和长度。分析每个字段的含义,包括字段的中文含义、字段所涉及的字典代码和字段规则(如业务规则、生成规则)。在分析了上述表、字段和字段的含义后,形成了以下结构的文档:字典代码字段规则idnumber(10)主键流量-流量,unitcodevarchar2(19)单位编码字典-2.1.2.完成第一步后,分析目标数据源的表关系,然后分析目标数据源的表关系。分析表关系最重要的是分析每个表之间的关联关系(如一对一、一对多、主键和外键),其次,需要根据业务分析每个表之间的隐性关联,例如,只有当A表中的某个值为03时,才与B表相关。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.数据源分析的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.1中的文档。对目标数据源的表关系进行分析后,形成以下Rose图:2.1.3.分析源数据源的数据结构方法与2.1相同.1.分析对象改为源数据源,分析后形成相同的2.1.文档1.2.1.4.分析源数据源的表关系方法与2.1相同.2.分析对象改为源数据源,分析后形成相同的2.1.2中的Rose图。2.1.5.根据目标数据源的表关系,根据目标数据源的表关系,分析其与源数据源表的对应关系。在这一步中,我们需要清楚地分析目标数据源的表数据来自源数据源,以及如何获取这些数据,分析后,可以形成一个标准来验证数据集成是否正确,也就是说,目标数据源的数据量应该与来源数据源的数据量一致。在分析过程中,仍然根据目标表的业务意义在源数据源的表中找到具有相同意义的表。在分析过程中,可能会遇到以下情况:意义相同的表通常使用一个表存储目标数据源和源数据源,意义相同的表通常是一对一的数据关系,例如,目标数据源中有一个表是常住人口的基本信息,源数据源中有一个常住人员的基本信息,两个表可以对应。当然,有时意义不一定相同,这需要从业务层面来判断。在这种情况下,目标数据源通常是一个表,源数据源是多个表。此时,形成多对一关系。例如,目标数据源中有一个表是项目表,源数据源中有几个表,如手机和证券。此时,您需要将手机和证券表对应于项目表。或者可能会遇到这样的现象,目标数据源是一个表,源数据源也是一个表,但源数据源每行记录包含两种类型的目标表记录,在这种情况下需要将源数据源记录分成两个进入目标表,如目标数据源是迁出表,其存储模式是单独记录存储,源数据源也是迁出表,但是,它的存储方式是在同一条记录中进行迁出和迁出。此时,将源数据源的迁出表的一行记录分为两条进行导入。具有包含意义的表与具有包含意义的表相反。含义表与上述含义表相反。根据业务的对应关系,这是最复杂的。例如,可能会遇到这样的现象。当源数据源中表的一个字段的值为多个时,需要将其分成两个记录并导入到目标表中。综上所述,目标数据源表和源数据源表可能存在一对一、一对多、多对一、多对多、条件对应几种关系,分析后形成以下文档:目标数据源数据源验证标准AAAA.数据量==A.数据量(变化(新增、编辑、删除)BB CB.数据量==B.数据量 C.数据量C DDC.数据量 D.数据量=D.数据量 C.数据量=D.数据量(D.wplx=’03’)D.数据量=D.数据量(D.wplx=’05’)EEE.数据量=E.数据量*2FFF.数据量=F.数据量/2(F.qrsj=F.qcsj)GGG.数据量=G.数据量 G.数据量(G.name包含,的总数-1)2.1.6.根据表的对应关系分析字段的对应关系和转换规则,根据表的单一对应关系(如目标数据源的B表对应源数据源的B表)、C表需要分为B对应B和B对应C两个步骤进行分析)来分析每个表中字段的对应关系和转换规则,相应的方法是:首先在相应的表中找到相应的字段,如果找不到相应的字段,需要从业务意义的角度推测字段是否需要合并多个字段或拆分字段,或根据某些业务规则生成字段的值。找到相应的字段后,首先根据类型和长度分析是否需要处理类型和长度,然后分析是否通过与其他表相关的字段获得,然后分析字段是否涉及字典代码。如果涉及,则需要比较两侧的字典代码是否一致,如果不一致,则需要形成两侧字典代码的对应关系,最后分析字段是否涉及业务意义,如果涉及,应注明如何处理。分析完成后,形成以下文档:idnumber(10)表名字段类型及长度源数据源字段类型及长度转换规则.idnumber(10)unitcodevarchar2(19).xzqh 表名.unitvarchar2(8) varchar2(20)单位代码字典映射contentvarchar2(100)Substr(表名.content,0,50、Varchar2(100)ifmonthVarchar2(1)If(表名.createdate.月份==系统时间的月份) Return‘1’;ElseReturn‘2’.unitnameVarchar2(100)UnitNames.unitNameVarchar2(100)表名.xzqh 表名.unit=UnitNames.UnitCode2.2.需要注意的问题是,数据集成是系统中最重要的基础,因此,在进行数据集成时,特别需要仔细考虑不会对数据产生破坏性影响,这也是数据分析过程中需要仔细考虑的问题。2.2.1.在进行数据分析时,需要考虑数据覆盖/混乱的问题,以便在集成数据后是否会非法覆盖或混淆现有数据。这个问题通常是由主键引起的,在进行数据分析时需要考虑。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.2.在进行数据分析时,需要考虑数据集成后可能出现的错误。对于这些可能出现的错误,需要制定相应的补偿方案,以避免数据的损坏。2.2.3.源数据源数据质量问题的解决方案需要考虑如何处理或避免源数据源本身的数据质量问题。2.2.4.在整个数据分析过程中,业务专家的支持可以看出,业务专家起着非常重要的作用。可以说,如果没有业务专家,数据分析很可能会失败,或者需要走很多弯路才能最终探索。可以肯定的是,在业务专家的支持下,整个数据分析过程将大大延长。从这个角度可以看出,在进行数据分析时,尽量得到业务专家的支持。3、总结上述方法对数据分析的过程和避免问题的方法进行了一定的描述。在实际的数据分析中,最重要的是负责数据分析的人对系统的理解。有系统设计经验的人成功进行数据分析的概率要高得多。一些非常专业的系统必须依靠有相应设计经验的人才来完成,比如流程系统的数据集成。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。在数据分析过程中,可以制定出判断数据集成是否成功的标准,也可以列为TDD的入口条件,J。方法论仍然是理论。我不是一个那么讲理论的人,但我不否认理论对实践有很好的指导作用。最好避免在实践过程中走太多弯路,将理论与实践相结合。理论指导实践,实践改进理论。

以上就是关于数据分析方法论有效性的评判关键是什么?的相关介绍,更多数据分析方法论有效性的评判关键是什么?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对数据分析方法论有效性的评判关键是什么?有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

有哪些专业高效的进销存软件破解版推荐

现在有不同的企业规模不一样,对于自己公司的管账职能要求也不一样,为了追求工作起来方便,所以很多企业会需要用到很多进销存软件,那么今天就来推荐一下进销存软件破解版。1、星空商务进销存通用版这款星空商务进销存通用版软件…查看详情

成本低传播广 一站式网络推广平台为企业赋能

一站式网络推广平台功能包含新闻媒体、自媒体、短视频、软文、抖音KOL、小红书博主、百科、问答、贴吧、论坛、友链、文案代写等,以“网络技术驱动全网推广”为使命,自主发布、自主下单、自主接单,依托云计算技术、平台大数据、…查看详情

生产管理ERP—让生产管理回归简单

内部信息难共享、部门协作不流畅、客户满意度低,是当前生产管理企业面临的巨大困扰。在互联网技术的推动下,生产管理ERP应运而生,让采购管理、项目管理、财务管理、人力资源管理、质量管理等环节走上智能化、自动化道路,真正将…查看详情

2021玄幻小说排行榜前5有哪些?哪些小说软件能免费读?

现在越来越多的年轻人都喜欢看动漫、读小说,特别是近几年很多玄幻类小说的IP都开始影视化、动漫化,但是由于动漫的更新进度较慢,很多粉丝都想先一睹原著小说为快。所以,小万整理了2021年玄幻小说排行榜前10的小说,以及能够读到这…查看详情

2021最新企业能源管理系统公司排名

备受关注的能源管理系统到底有什么用?能源管理系统可以帮助工业生产企业在扩大生产的同时,合理计划和利用能源,降低单位产品能源消耗,提高经济效益,那么2021最新企业能源管理系统公司排名到底是一个什么样的情况?一起来看看。&…查看详情

网络版权登记协助侵权纠纷解决 快来了解一下!

网络著作权也是受到网络著作权法保护的,网络著作权法规定了侵犯网络著作权的赔偿标准,发生网络著作权侵权纠纷时,侵权人应当承担因此而遭受的损失。想要进行赔偿需要先对侵权行为进行认定,网络版权登记所取得的版权证明可以作为有…查看详情

网站备案怎么办理?详细流程几步搞定!

  尽管我国早已启动了网站备案工作,但许多网站仍然处于未备案的状态,这就让不法分子钻到漏洞,对网站发起攻击。目前,所以使用国内服务器的网站都必须进行网站备案,备案不仅是为了保障网站经营者和网民的权益外,在一定程度…查看详情

淘宝目标客户群体是哪些?

  优质答案(1)  全店。淘宝现在的市场几乎都是曾经购买过商品的买家,每个人都有不同的购买习惯,风格偏好,购买能力,这也是缤纷缭乱的淘宝商品中给买家的便利,每个买家都被打好标签,根据分发的流量不同,分发的宝贝也不…查看详情

想要入坑视频制作的小伙伴一定要看完本文

现在市面上有许多制作视频的软件,很多想入坑的网友都不知道怎么选择合适的软件,下面我为大家整理出来了制作视频的软件哪个好。想要入坑的小伙伴可以来看看了。1.会声会影会声会影是一个综合能力十分强大的视频编辑软件,因此我们…查看详情

幼儿学知识软件哪个好 幼儿学知识软件排行榜

  孩子在成长期的教育是很重要的,现在市面上有很多的孩子学习的软件,下面小编就来给大家详细介绍一下幼儿学知识软件哪个好 幼儿学知识软件排行榜这一块的相关内容,希望能帮助到大家。  幼儿学知识软件排行榜  1、《叽…查看详情

企业搭建网站 | 申请域名该去哪?

申请域名该去哪?其实有很多的渠道都可以进行域名申请,主要分为国内和国外两大平台。那么如何判断自己应该选择国内或国外平台呢?主要根据你后续搭建的网站在哪儿运营做判断。接下来小万主要给大家讲讲在国内平台如何申请域名以…查看详情

商标注册后如何申请共有?以下两个方法可分别适用不同的情况

商标注册可以由多个主体共同申请办理,这样申请下来的商标专用权由多名申请人共同拥有。这是在提出商标申请的时候,就明确了该商标为共有商标,那么,商标注册后如何共有呢?图片来源于网络共有商标的概念:两个以上的自然人、法…查看详情

推荐几款免费的电脑录音软件,好用又方便

随着声优的出现,好多用户都争相模仿,这就用到了电脑录音软件了,但是在哪里找免费的电脑录音软件呢?今就让小编我给大家推荐几款免费的电脑录音软件,感兴趣的小伙伴一起来看一下吧。1.迅捷录音软件该软件是一款专门录制音频的软…查看详情

免费ppt模板下载网站有哪些?

如何在优品PPT里面下载模板?可以在优品PPT的官网上下载模板。因为优品PPT是一个提供PPT模板资源的网站,官网上提供了大量的免费和付费模板供用户下载使用。用户可以通过以下步骤在官网上下载模板:首先,进入优品PPT官网;其次,在首页…查看详情

数据库sql语句大全实例

查询数据库中有哪些表的sql语句?一、查询指定模式下的所有表db2LISTTABLESFORSCHEMA模式名二、查询当前模式下所有表及信息db2selecttabnamefromsyscat.tableswheretabschema=CU...查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询