首页 >知识讲堂 >数据分析知识>分析案例丨朝阳医院在2018年里的销售情况

分析案例丨朝阳医院在2018年里的销售情况

2020-12-28 11:18:47 阅读(184 评论(0)

1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]:       购药时间     社保卡号  商品编码  销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五   001616528 236701 强VC银翘片  6 82.8  691 2018-01-02星期六   001616528 236701 清热解毒口服液  1  28 24.642 2018-01-06星期三  0012602828 236701   感康  2 16.8  153 2018-01-11星期一 0010070343428 236701  三九感冒灵  1  28  284 2018-01-15星期五  00101554328 236701  三九感冒灵  8 224  208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间  6576社保卡号  6576商品编码  6577商品名称  6577销售数量  6577应收金额  6577实收金额  6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前  ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值  ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后  ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据  ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8")  ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8")  ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8")  ...:dataDF.dtypesOut[13]:销售时间  object社保卡号码  object商品编码  object商品名称  object销售数量  float64应收金额  float64实收金额  64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数  ...:defsplitsaletime(timeColser):  ...:  timelist=[]  ...:  fortintimeColser:  ...:    timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片  ...:  timeser=pd.Series(timelist) #将列表转换为一维数据Series类型  ...:  returntimeser  ...:In[16]:#获取"销售时间"这一列数据  ...:t=dataDF.loc[:,"销售时间"]  ...:#调用函数去除周,获取日期  ...:timeser=splitsaletime(t)  ...:#修改"销售时间"这一列日期  ...:dataDF.loc[:,"销售时间"]=timeser  ...:dataDF.head()Out[16]:     销售时间     社保卡号  商品编码  商品名称 销售数量 应收金额  实收金额0 2018-01-01   001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02   001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06  0012602828 236701   感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701  三九感冒灵 1.0 28.0 28.004  2018-01-15    00101554328  236701    三九感冒灵   8.0  224.0  然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期  ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat  ...:dataDF.loc[:,"销售时间"]=

以上就是关于分析案例丨朝阳医院在2018年里的销售情况的相关介绍,更多分析案例丨朝阳医院在2018年里的销售情况相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对分析案例丨朝阳医院在2018年里的销售情况有更深的了解和认识。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

查旅游景点用什么软件好(旅游攻略软件)

随着人们生活水平的不断提高,娱乐产业逐渐成为国民经济的一部分,旅游是很多小伙伴心中向往的一种娱乐活动。出行前做一个旅游攻略计划,会让你的出行更加有趣。所以我给大家推荐6款良心的旅游攻略软件:1.去哪儿旅行这款app是中国…查看详情

中小企业如何选择适合自己公司的会计软件?

当今社会,企业信息化逐渐普及,越来越多的会计软件公司涌现出来,会计软件种类也越来越多。于是,对于软件的选购,也成了目前企业,尤其是缺乏经验的中小企业面临的一大问题。那么如何在诸多的会计软件中选择适合自己的软件,最…查看详情

windows10怎么关机

  一、如何关机  在Windows10中关机的方法有多种,下面介绍几种方法:  1.使用开始菜单:点击“开始”菜单,在开始菜单中单击“电源”符号,然后选择“关机”即可将计算机关闭。  2.使用快捷键:按下“Windows”键和“X”键组合...查看详情

短视频去水印免费软件,在线轻松去水印

如今我们的生活中离不开各种记录生活的方式,就比如说当下最为流行的短视频,那有些人要用到一些里面好看的图片或者背景图,那他们为了保护不让别人使用,弄了水印该怎么办呢?别急,我有办法。当然,水印诞生就会有解决的方法,…查看详情

ipo上市是什么意思

  IPO,InitialPublicOffering,即首次公开发行股票。其简单的定义是指一家未上市的公司,向公众发行股票,并在证券交易所上市交易。IPO是一种重要的筹资方式,可帮助公司募集大量资金,扩大规模,加强竞争力,提高企业价值。 ...查看详情

aac是什么音频格式

AAC什么意思?aac(AdvancedAudioCoding),中文名:高级音频编码,出现于1997年,基于MPEG-2的音频编码技术。AAC,全称AdvancedAudioCoding,是一种专为声音数据设计的文件压缩格式。与MP3不同...查看详情

一对一付费陪聊天的app有哪些?

  一对一付费陪聊天的app有哪些?很多小伙伴都不清楚,这里是小编为大家提供的2022一对一付费陪聊天的app排行榜,每一款软件都正规安全,海量用户在线,自由寻找喜欢的对象开启聊天模式,一对一聊天,先支付后畅聊,没有内容限制,…查看详情

知识产权查询 | 专利查询可查询到哪些信息?

知识产权,其中又包括了著作权、商标、专利等。简单来说,知识产权涵盖了专利,而专利就是知识产权的一种。今天小万就为大家讲解一下,知识产权查询中的专利查询,它究竟可以查询到哪些信息呢?图片来源于网络知识产权查询中的专…查看详情

html文本类型是什么?

html文本类型是什么?它是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。是超文本标记语言。HTML文件的结构包括头部(Head)、主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。html...查看详情

淘宝账号如何注册,附上详细注册流程

  做淘宝,小号是避不开的话题。自己注册淘宝小号限购,买淘宝老白号使用也是各种异常,下面小编就给大家来详细介绍一下淘宝账号如何注册这一块的内容,希望能帮助到大家。  淘宝账号如何注册  1.手机号码登记方法如下。  …查看详情

windows10更新遇到错误怎么解决

  更新是任何操作系统中的重要部分,包括Windows10。系统更新可以为操作系统提供许多新的功能,修复漏洞和错误,并提高系统性能和安全性。但是,有时Windows10更新会遇到错误,导致系统无法更新。在本文中,我们将探讨Windows10...查看详情

浅析企业员工信息管理系统现状

在当今社会,互联网空间的发展,给人们的工作和生活带来了极大的便利和高效,信息化、电子化已经成为节约运营成本,提高工作效率的首选。当前大量企业的员工管理尚处于手工作业阶段,不但效率低下,还常常因为管理的不慎而出现纰…查看详情

解放人力的全新科技——配电房监控系统

随着科技的不断发展,电力成了我们生活中最方便也最常见的能源,配电站也成了我们日常生活中随处可见的建筑,可配电房复杂的环境要求和技术要求带来了很多管理和成本上的问题,为此在这里我们将推荐一样东西——配电房监控系统。&n…查看详情

新手必备家装网站建设的建议赶紧收藏起来

在这次疫情期间,线下家装行受到巨大的冲击,而线上家装网站受到的影响很小。很多人由此决定建立属于自己的家装网站,但是对于新手而言往往不知道从何下手。不清楚建设重点是什么,又害怕被建站公司给坑骗了。今天小万就整理一些…查看详情

微信免费投票系统推荐,你最PICK哪一个

在工作生活中,我们都有可能会遇到要投票的情况,下面几款投票软件神器可以帮助我们快速获得更多的投票,轻松获胜。对此有需要的朋友可以关注下载。投票神器投票神器app是微信投票不求人的客户端应用。使用投票神器可以轻松获得高…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询