首页 >知识讲堂 >数据分析知识>分析案例丨朝阳医院在2018年里的销售情况

分析案例丨朝阳医院在2018年里的销售情况

2020-12-28 11:18:47 阅读(185 评论(0)

1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]:       购药时间     社保卡号  商品编码  销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五   001616528 236701 强VC银翘片  6 82.8  691 2018-01-02星期六   001616528 236701 清热解毒口服液  1  28 24.642 2018-01-06星期三  0012602828 236701   感康  2 16.8  153 2018-01-11星期一 0010070343428 236701  三九感冒灵  1  28  284 2018-01-15星期五  00101554328 236701  三九感冒灵  8 224  208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间  6576社保卡号  6576商品编码  6577商品名称  6577销售数量  6577应收金额  6577实收金额  6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前  ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值  ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后  ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据  ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8")  ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8")  ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8")  ...:dataDF.dtypesOut[13]:销售时间  object社保卡号码  object商品编码  object商品名称  object销售数量  float64应收金额  float64实收金额  64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数  ...:defsplitsaletime(timeColser):  ...:  timelist=[]  ...:  fortintimeColser:  ...:    timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片  ...:  timeser=pd.Series(timelist) #将列表转换为一维数据Series类型  ...:  returntimeser  ...:In[16]:#获取"销售时间"这一列数据  ...:t=dataDF.loc[:,"销售时间"]  ...:#调用函数去除周,获取日期  ...:timeser=splitsaletime(t)  ...:#修改"销售时间"这一列日期  ...:dataDF.loc[:,"销售时间"]=timeser  ...:dataDF.head()Out[16]:     销售时间     社保卡号  商品编码  商品名称 销售数量 应收金额  实收金额0 2018-01-01   001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02   001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06  0012602828 236701   感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701  三九感冒灵 1.0 28.0 28.004  2018-01-15    00101554328  236701    三九感冒灵   8.0  224.0  然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期  ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat  ...:dataDF.loc[:,"销售时间"]=

以上就是关于分析案例丨朝阳医院在2018年里的销售情况的相关介绍,更多分析案例丨朝阳医院在2018年里的销售情况相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对分析案例丨朝阳医院在2018年里的销售情况有更深的了解和认识。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

申请音乐版权登记 登记一次 终生保护

有很多朋友写了不错的词、曲、歌,这些都是你们的劳动成果,凝结了自己的心血与智慧结晶,要保护不受侵犯,最好的办法就是去申请音乐版权登记。图片来源于网络这样一来你们所有的作品都得到了法律的保护,而且要将原创歌曲做市场…查看详情

盘点6款比较安全的手机系统修复软件

随着科学技术的不断进步,电脑和手机也普及,一些系统漏洞、故障也随之而来。系统修复软件对于手机是不可缺少的。下面是我给各位小伙伴们盘点的6款比较安全的手机系统修复软件,内容如下:1.金星系统恢复大师它是一款方便、快捷、…查看详情

电脑定时关机软件该如何选择呢?这几款效果好

日常使用电脑的时候,如果能够下载一个定时关机的软件,不仅能够节省电能,还可以减少电脑的损耗,而对于家中有孩子的人群来说,设置定制关机也能够减少孩子玩电脑的时间,避免对于视力的损伤,那么,电脑定时关机软件该如何选择…查看详情

新手选用视频剪辑软件哪个好?

视频剪辑对于普通人来说恐怕是一项很高大上的操作,但实际中,视频剪辑不光是对视频随便剪一剪就可以,其中要对所谓的光学、调色有一定的基础,毕竟在剪辑的眼中,视频能更好的呈现,才是最好的,那么今天我们就盘点一下视频剪辑…查看详情

【国家版权局】我国对国际版权登记条约的规定实施

目前,各国版权登记保护内容都依该国相关条例实施。从登记方法、保护期限、权利人专有权益等各有不同。我国对国际版权登记部分条约的规定如下: 图片来源于网络 实施国际版权登记条约的规定(1992)第一条 为实施国际著...查看详情

淘宝c店是什么意思?怎么开淘宝c店

天猫里面,什么叫C店?淘宝C店其实就是个人店铺、集市店铺的意思,淘宝网上有2种,一种是普通的集市店铺,一种是商城店铺(天猫),你也可以理解为除了天猫商城之外,其他的就是淘宝网C店!C代表个人(Consumer),B代表商家(Business...查看详情

好用的小区物业智能门禁系统推荐

目前社会发展越来越快,人们对各方面的安全要求也越来越高,家居安全也是其中之一,所以小区物业智能门禁系统也就应时而生,安全性能高还便于物业管理。市场上现在拥有众多知名的智能门禁品牌,那么到底哪些是真正好用便捷的呢?…查看详情

注册商标在哪查询 注册商标查询方法

  标注册对企业是非常重要的,而且多内企业对于知识产权的重视程度相当高,商标是商业销售形式当中重要的一部分,广为人知的商标对产品销售起着决定性作用,因此商标注册过程中的前提工作,关乎到商标注册是否能够成功,尤其是…查看详情

2022年免费域名注册平台有哪些

  今天我们来说说如何注册一个自己想要的域名,不管是国内的还是国外的,今天都跟大家来说说有哪些平台可以注册。国内域名注册商的劣势就是提供的域(就是后缀,如‘.me’、‘.io’等)相对较少。而且转出也比较麻烦。另外还有一…查看详情

比价软件app哪个好 十大手机全网比价app排行榜

  都说买的没有卖的精,不过比价软件的出现彻底终结了这种说法。下面万商云集*就给大家来介绍下比价软件app哪个好,希望能帮助到大家。  在今年双十一时,所有PC端比价软件齐遭阿里旗下电商平台禁用,理由嘛*不说你也懂的。但是…查看详情

客户答疑|商标注册为什么不能百分百成功?

很多企业在刚开始了解商标注册时会产生这样的困惑:为什么商标注册不能保证百分百的成功率呢?既然注册失败了,为什么不能退款呢?首先让我们了解下决定商标注册成功与否的因素是什么?最终能否成功,并不以代理机构的查询结果为…查看详情

*丨200元大牌产品代金券,这波*不领后悔!

天下熙熙皆为利来,天下攘攘皆为利往。企业求利,无可厚非,如何才能取之有道?而在互联网背景之下,行业竞争日趋白热化,上阵赤搏,谁又能独占鳌头?竞争无处不在,同行又是仇人,谁的步子慢,谁就先灭亡!2020进入倒计时,可你还…查看详情

数码网店开设流程(数码店铺开店程序有哪些)

什么数码店铺在淘宝京东和拼多多都有店?小米数码店铺在淘宝、京东和拼多多都有店。因为小米是国内知名的数码品牌之一,在电商平台上开设自己的店铺是常见的营销手段,也有助于提高品牌曝光率和销售量。同时,小米在多个电商平台上…查看详情

想做网络营销,网络营销好做吗?

现在,许多人都想去学网络营销,但他们同样担心网络营销好做吗,思考做了网络营销对自己有什么用处。在这里可以肯定地告诉有需要的用户,做网络营销肯定是有用的,因为现在各大企业都在做网络营销,等到步入社会,网络营销就很有…查看详情

受好评3款精品工资系统软件推荐

在我们的社会中,我们为了赚钱就会去找一些工作,去做努力的赚更多的钱,去生活更美好的生活。那么赚取的东西就是工资,当然,对于公司以及企业来说,对于员工的工资的管理是一件非常重要的事情,那么它也应该得到重视,于是现在…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询