首页 >知识讲堂 >数据分析知识>分析案例丨朝阳医院在2018年里的销售情况

分析案例丨朝阳医院在2018年里的销售情况

2020-12-28 11:18:47 阅读(187 评论(0)

1、数据分析的目的数据分析是指通过适当的统计分析方法对收集到的大量数据进行分析,提取有用的信息,形成结论,并对数据进行详细研究和总结的过程。在本文中,假设以2018年朝阳医院的销售数据为例,目的是了解2018年朝阳医院的销售情况,需要了解月平均消费次数、月平均消费金额、客户单价、消费趋势等几个业务指标。2、数据分析的基本过程包括:数据获取、数据清洗、模型构建、数据可视化和消费趋势。2.1获取数据Excel中数据部分的截图:先导入包,再读取文件,读取时用object读取,防止一些数据无法读取:In[1]:importpandasaspdIn[2]:#读取数据(最好使用object类型) ...:data=pd.read_excel("2018年朝阳医院销售数据.xlsx",dtype="object")In[3]:#修改为DataFrame格式 ...:dataDF=pd.DataFrame(data)In[4]:dataDF.head()Out[4]:       购药时间     社保卡号  商品编码  销售商品名称的数量 应收金额 实收金额0 2018-01-01星期五   001616528 236701 强VC银翘片  6 82.8  691 2018-01-02星期六   001616528 236701 清热解毒口服液  1  28 24.642 2018-01-06星期三  0012602828 236701   感康  2 16.8  153 2018-01-11星期一 0010070343428 236701  三九感冒灵  1  28  284 2018-01-15星期五  00101554328 236701  三九感冒灵  8 224  208查看In[5]这些基本信息:#查看数据的形状,即几行几列 ...:dataDF.shapeOut[5]:(6578,7)In[6]:#查看索引 ...:dataDF.indexOut[6]:RangeIndex(start=0,stop=6578,step=1)In[7]:#查看每列列表头的内容 ...:dataDF.columnsOut[7]:Index(['购药时间','社保卡号','商品编码','商品名称','销售量','应收金额','实收金额'],dtype='object')In[8]:#查看每列数据统计数量 ...:dataDF.count()Out[8]:购药时间  6576社保卡号  6576商品编码  6577商品名称  6577销售数量  6577应收金额  6577实收金额  6577dtype:int64共有6578行7列数据,但“药品购买时间”和“社会保障卡号”两列只有6576个数据,“商品代码”到“实收金额”这两列只有6577个数据,这意味着数据缺失值,可以推断数据缺失值,除了“药品购买时间”和“社会保障卡号”两列各有一个缺失数据,这些缺失数据需要在以下步骤中进一步处理。2.2数据清洗数据清洗过程包括:选择子集、列名重命名、数据处理缺失、数据类型转换、数据排序及异常值处理2.2.1在我们获得的数据中选择子集,数据量可能非常大,不是每个列都有价值需要分析。此时,我们需要从整个数据中选择合适的子集进行分析,以便从数据中获得最大的价值。在这种情况下,不需要选择子集,这一步暂时可以忽略。2.2.在数据分析过程中,一些列和数据容易混淆或模棱两可,不利于数据分析。此时,需要将列替换为易于理解的名称,可以通过rename函数实现:In[9]:#使用rename函数,把"购药时间"改为"销售时间" ...:dataDF.rename(columns={"购药时间":"销售时间"},inplace=True) ...:dataDF.columnsOut[9]: Index(['销售时间', '社保卡号', '商品编码', '商品名称', '销售量', '应收金额', '实收金额'], dtype='object')2.2.在缺失数据处理获得的数据中很可能存在缺失值,通过查看基本信息,可以推断“购药时间”和“社保卡号”存在缺失值。如果不处理这些缺失值,会干扰以下数据分析结果。缺失数据的常用处理方法是删除包含缺失数据的记录或使用算法来补充缺失数据。为方便起见,dropna函数直接用于删除缺失的数据,具体如下:In[10]:#在删除缺失值之前  ...:dataDF.shapeOut[10]:(6578,7)In[11]:#使用dropna函数删除缺失值  ...:dataDF=dataDF.dropna()In[12]:#删除缺失值后  ...:dataDF.shapeOut[12]:(6575,7)2.2.在导入数据时,4数据类型的转换是为了防止导入不进来,所有数据都是object类型,但在实际数据分析过程中,“销售数量”、“应收金额”和“实收金额”需要浮点类型(float)数据、“销售时间”需要改为时间格式,因此需要转换数据类型。可以将astype()函数转换为浮点数据:In[13]:#将字符串转换为浮点数据  ...:dataDF["销售数量"]=dataDF["销售数量"].astype("f8")  ...:dataDF["应收金额"]=dataDF["应收金额"].astype("f8")  ...:dataDF["实收金额"]=dataDF["实收金额"].astype("f8")  ...:dataDF.dtypesOut[13]:销售时间  object社保卡号码  object商品编码  object商品名称  object销售数量  float64应收金额  float64实收金额  64dtypefloat64dtype:在“销售时间”这一列数据中,object存在星期这样的数据,但是在数据分析过程中不需要使用,所以要用split函数来划分销售时间列的中日期和周期,分割后的时间,Series数据类型返回:In[15]:#星期去除定义函数  ...:defsplitsaletime(timeColser):  ...:  timelist=[]  ...:  fortintimeColser:  ...:    timelist.append(t.split("")[0]) #[0]表示选定的分片,这意味着切割后选择第一个分片  ...:  timeser=pd.Series(timelist) #将列表转换为一维数据Series类型  ...:  returntimeser  ...:In[16]:#获取"销售时间"这一列数据  ...:t=dataDF.loc[:,"销售时间"]  ...:#调用函数去除周,获取日期  ...:timeser=splitsaletime(t)  ...:#修改"销售时间"这一列日期  ...:dataDF.loc[:,"销售时间"]=timeser  ...:dataDF.head()Out[16]:     销售时间     社保卡号  商品编码  商品名称 销售数量 应收金额  实收金额0 2018-01-01   001616528 236701 强大的VC银翘片 6.0 82.8 69.001 2018-01-02   001616528 236701 清热解毒口服液 1.0 28.0 24.642 2018-01-06  0012602828 236701   感康 2.0 16.8 15.003 2018-01-11 0010070343428 236701  三九感冒灵 1.0 28.0 28.004  2018-01-15    00101554328  236701    三九感冒灵   8.0  224.0  然后将切割后的日期转换为时间格式,以下数据统计方便:In[17]:#字符串转日期  ...:#errors='coerce'如果原始数据不符合日期格式,则转换值为Nat  ...:dataDF.loc[:,"销售时间"]=

以上就是关于分析案例丨朝阳医院在2018年里的销售情况的相关介绍,更多分析案例丨朝阳医院在2018年里的销售情况相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对分析案例丨朝阳医院在2018年里的销售情况有更深的了解和认识。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

开网店的简介怎么写才更加吸引人?

淘宝店铺简介要怎么写才能更吸引消费者选择我的店铺呢?本文带来大堆满满干货,为大家解决开网店的简介怎么写才更加吸引人的问题。淘宝店铺介绍通俗来讲其实就是反映和说明店铺的基本经营情况,店铺介绍的意义店铺介绍就是让顾客…查看详情

这份网站建设企业排名必须收藏!

随着我国不断迈入互联网时代,紧抓住网络机会成为了致富密码。拥有一个自己的网站是企业重要的营销战略手段,它包含了企业的特色,主营内容,作品风格等等,是企业最重要直观的形象。因此需要寻找一个优秀的网站建设企业为企业打…查看详情

有哪些好的大牌女装品牌店呢?

由于世界男女比例平衡女性的需求也越来越大,女性在选择女装时比较倾向于大牌女装品牌店,这叫影响了我们在购物时会踩很多雷会买到假货假衣服,为了给大家一个好的体验效果特此为大家整理出比较出名的大牌女装品牌店,供大家参考…查看详情

京东上的合约机划算吗?

  优质答案(1)  京东的合约机当然可以购买。  京东商城有很多的合约机能够购置,由于是合约机,所以价钱方面都十分的实惠。  购买须知:  1、业务/号卡激活、入网首月资费问题:  联通:大局部业务均已激活,插动手机…查看详情

淘宝卖家违规是什么原因造成的?

  优质答案(1)  第一步,待您处理的违规是指:此处将为您展示可能需要您进行申诉、编辑、下架、删除或者其它操作的记录,请您务必加以重视。是淘宝告诉你,你店铺有某些违规需要处理,处理后提交申诉等。淘宝会再次检查,再…查看详情

日本十大经典老电影

  优质答案(1)  《恋空》。它是今井夏木执导,渡边睦月、美嘉担任编剧,新垣结衣、三浦春马主演的爱情伤感电影。电影根据同名手机小说改编而成。该片讲述了普通高中一年级学生美嘉与帅气的同级生弘树偶然相识,两人由此坠入…查看详情

【杭州代运营公司排名】“互联网之乡”的友情推荐,仅供参考!

杭州有“互联网之乡”的称呼,主要是因为杭州是信息经济的先发城市,在电子商务产业领域具有明显的带动力。杭州当地有阿里巴巴、网易、百度等互联网名企,在智能、金融、农业和物流等相关“互联网+”行业发展相当迅速,也因此存在2…查看详情

新手入行动画行业必备三款软件

可能很多人对于动画这方面的认知非常少,有些人觉得现在做动画已经不受欢迎了,所以,赚不到什么钱,其实你想错了,我们只需要把做出来的动画发布到各个平台上就可以有流量,那么,制作动画软件有什么?1、Pofi无限人偶pro是一款手机…查看详情

网络广告被消费者排斥情况下,该如何做网站推广?

移动互联网时代,人人都是流量消费者,流量呈现出碎片化、分散化的特点。传统的竞价推广方式,标有明显的广告标示不容易被消费者接受,这样的网络营销推广手段在一定程度上已经不能满足企业的网站推广目的。如今,网络广告被消费…查看详情

财务软件哪个好 好用的财务软件推荐

  现在深受疫情的影响很多的小伙伴都开始使用财务软件来给自己记账,看一下平时的日常开支,下面万商云集*给大家来详细介绍一下财务软件哪个好 好用的财务软件推荐这一块的内容,不知道下面的软件大家使用过没有。  一、钱…查看详情

推荐几款人力资源管理咨询系统,注意了解优缺点

在日常的工作中,各个部门如果都可以将网络的技术运用到工作中,那么自然也能够提升效率,但是会发现相应的一些系统都是非常多的,可能在选择的时候也十分的迷茫,不知道哪一款比较好,下面就为大家推荐几款人力资源管理咨询系统…查看详情

网页游戏排行榜2021前六名

小型页游可以让你放松心情,动动手指就可以闯过很多的关卡,它没有大型页游的那种厮杀热血的感觉。如果你没有找到好玩的游戏,下面是我给大家整理的小型页游排行榜前六名,喜欢玩游戏的小伙伴可以看看。1.汤姆猫跑酷它是由会说话的…查看详情

专利权可以共享吗?专利权能不能共享?

    在平时很多的小伙伴都不知道专利权可以共享吗的基本情况,而且对专利权可以共享吗都不是很熟悉,下面万商云集*就为大家整理了专利权可以共享吗这方面的相关内容,希望下面的内容能帮助到各位。 。  一、专利权能不能共…查看详情

淘宝抵价券使用注意事项是什么?

一堆5元淘宝购物券,不知道怎么用?在付款的时候,付款界面,会有一个“使用抵价券”的显示,你在前面打勾勾就好了前提是,你要买的那家店的东西,是支持使用抵价券的哦淘宝的抵价券一次交易中只能用一张吗?三、使用抵价券1、必须在抵价券…查看详情

练打字软件哪个好 练打字软件排行榜

  随着现在越来越的朋友时候电脑、手机、平台等智能产品,输入法应该生活中不可缺少的一部分。当然,有些朋友觉得自己打字速度不快,想要提高自己的打字速度。今天,笔者就给大家带来几款不错的练习打字软件,下面*就给大家来详…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询