首页 >知识讲堂 >数据分析知识>Python爬取捞月狗数据分析

Python爬取捞月狗数据分析

2020-12-30 10:32:11 阅读(212 评论(0)

本文利用Python从捞月狗网站上获取国服各区和外服王者的数据信息,然后利用R软件对数据进行初步探索和分析。在数据背后找到有趣的东西!爱生活,爱数据!Python爬月狗数据要抓取的数据如下图所示:主要包括王者游戏ID、区服、胜点、胜点、负场、胜率、最近状态、擅长位置、本命英雄等。因为钓月狗的数据每天都在更新,所以在不同的时间爬行数据可能会有所不同。Python代码如下:导入所需模块:importrequestsimportportpandasaspd设置头部信息:head={'User-Agent':'你自己的头部信息'}设定正则获取国服王者信息:rem=re.compile(r'class="subStrTitle">(.*).*server">(.*).*class="icon-dan">(.*).*(.*)(.*)<.*\t/.*(.*)(.*).*"percentage">(.*).*/score/(.*).png.*color-zhongdan">(.*).*alt="(.*)"/>.*alt="(.*)"/>.*alt="(.*)"/>',re.S)外服正则用于获取外服王者信息:reh=re.compile(r'(.*).*player-server">(.*).*(.*).*(.*)(.*).*.*(.*)(.*).*"percentage">(.*).*score/(.*).png.*"color-zhongdan">(.*).*src="(.*)">.*src="(.*)">.*src="(.*)">',re.S)获取国服对应的战区,存储在zhanqu_list_cn中:url_cn='http://www.laoyuegou.com/x/zh-cn/lol/lol/godrank.htmlregion=cn&area=1'html_cn=requests.get(url_cn,headers=head)reg=re.compile(r'class="cn-li.*href="(.*)">',re.S)zhanqu_list_cn=re.findall(reg,html_cn.text)#国服战区获得外服对应的战区,存储在zhanqu_list_en中:url_en='http://www.laoyuegou.com/x/zh-cn/lol/lol/godrank.htmlregion=foreign&area=kr'html_en=requests.get(url_en,headers=head)ren=re.compile(r'class="foreign-li.*href="(.*)">',re.S)zhanqu_list_en=re.findall(ren,html_en.text)定义下载中国战区数据的函数:defupdown_cn(zhanqu_list_cn):  forzhanquinzhanqu_list_cn:    forminrange(1,11):      url=zhanqu '&page=' str(m)      im=requests.get(url,headers=head)      ifim.status_code==200:        data=re.findall(rem,im.text) #数据rem代表国服数据        data=pd.DataFrame(data)        data.to_csv('/home/wajuejiprince/文档/LOLDT/LOLDT.csv',header=False,index=False,mode='a ')#写csv文件,'a '是追加模式        data=[]定义下载外服战区数据的函数:defupdown_en(zhanqu_list_en):  forzhanquinzhanqu_list_en:    forminrange(1,11):      url=zhanqu '&page=' str(m)      im=requests.get(url,headers=head)      ifim.status_code==200:        data=re.findall(reh,im.text) #获取数据reh代表外服数据        data=pd.DataFrame(data)        data.to_csv('/home/wajuejiprince/文档/LOLDT/LOLDT.csv',header=False,index=False,mode='a ')#写csv文件,'a '是追加模式        data=[]下载数据:updown_cn(zhanqu_list_cn) #下载中国战区数据updown_en(zhanqu_list_en) #下载外服战区数据下载的数据保存格式为CSV格式,内容如下图所示:查看数据后,只发现几个格式异常数据(已手动删除)。R语言数据初步探索下面用R软件分析数据,看看能不能发现一些有趣的东西!R语言程序包用于导入分析:library(data.table)library(plotly)library(magrittr)library(wordcloud2)导入数据:dt=fread(file.choose()国服数据:dt_cn=dt[1:2500]#即前2500个外服数据:dt_en=dt[2501:4480]各战区王者数量(国服):>dt_cn[,.(.N),by=.(战区)   所在战区 N1: 艾欧尼亚 902:   祖安 803: 诺克萨斯 804: 班德尔城 905:皮尔特沃夫 90...25: 扭曲丛林 9926:教育网专区 2527: 巨龙之巢 9028: 男爵领域 9029: 峡谷之巅 80   所在战区 N概览数据(国服):>summary(dt_cn[,.(.N),by=.(战区)) 所在战区       N     Length:29     Min. :25.00 Class:character 1stQu.:80.00 Mode :character Median:90.00           Mean :86.21           3rdQu.:90.00           Max. :100.00 #王者最少的区>dt_cn[,.(.N),by=.(战区)[N==25]  所在战区 N1:教育网专区25#王者有100人(最多100人)>dt_cn[,.(.N),by=.(战区)[N==100] 所在战区 N1:均衡教派1002:守望之海100外服王者数量:plot_ly(dt_en[,.(.N),by=.(战区),x=~所在战区,y=~N,type="bar")外服王者数量较多(相对于国服一区),可能是有些外服只是服务器,比如韩国,也和捞月狗的统计数据有关。国服各区平均胜点:dt_cn[,.(mean=mean(胜点),by=.(战区)这里看不出艾欧尼亚是最强的战区。王者通常处于什么样的游戏状态?wordcloud2(dt_cn[,.(.N),by=.(最近状态))英雄联盟的评价等级是这样增加的D-,D,D ;C-,C,C ;B-,B,B ;A-,A,A ;S-,S,S !国王通常处于什么样的游戏状态:wordcloud2(dt_cn[,.(.N),by=.(最近状态))英雄联盟的评价等级是这样增加的D-,D,D ;C-,C,C ;B-,B,B ;A-,A,A ;S-,S,S !大多数王者最近的状态往往是S级状态。不幸的是,数据集中没有其他部分的数据。如果是这样,你也可以比较每个部分玩家的通常游戏状态。王者擅长的位置:各地的王者更喜欢打野和上单的位置。这两个位置也是英雄联盟中受伤较多的位置,也可以说他们可能更倾向于玩“肉”的英雄。职业联赛中常说这样的英雄容错率比较高。换句话说,有肉有输出英雄。王者本命英雄(2017.08.05):#因为有些本命英雄在爬数据的时候并不是我们预期的,所以在这里删除(也就是3~4).dt_all=fread(file.choose())dt_cn<-dt_all[1:2497]dt_1<-dt_cn[,本命英雄1]dt_2<-dt_cn[,本命英雄2]dt_3<-dt_cn[,本命英雄3]all_hero�ta.frame()%>%wordcloud2(shape='star')#以星形的形式绘制云图。不愧为王者玩家,玩盲僧这样

以上就是关于Python爬取捞月狗数据分析的相关介绍,更多Python爬取捞月狗数据分析相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对Python爬取捞月狗数据分析有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

连锁收银系统该如何选择?

对连锁店来讲,有一个好用的收银系统是必不可少的,而好用的意思可以理解为功能操作简单。所以对于店铺来讲,在选择收银系统的时候,会发现每个收银系统都有自己擅长的领域。中伦收银系统作为实体零售连锁店企业提供的集店收银软…查看详情

电商网站制作需要留心的地方有哪些

现在的企业电商网站制作可谓如火如荼,不知从什么时候开始互联网上就流行起网络购物。看着别家企业日渐壮大,都纷纷去制作自己的电商网站,希望在这个互联网上利用电商网站让企业得到更多利益。接下来小万来给大家说说,企业电商…查看详情

公认好用的电脑拼图软件,设计师们都在用

现在,当你不想一次性发特别多的图片时,可以把许多图片整合起来,拼在一起,这时候我们就需要拼图软件的帮助了,那么有哪些电脑拼图软件呢?来看看我推荐的电脑拼图软件吧。1.简拼一款小清新风格简单拼图app,是推荐量最高的拼图软…查看详情

ps新手入门基础教程

PS基础教程?ps新手入门教程1.首先打开ps,点击文件,新建2.宽度跟高度单位为像素,确定3.右键单击左侧工具栏的第二工具,选择矩形选框工具或者是椭圆选框工具4.在画布上绘制图形,点击右下方的创建新图层5.在左侧工具栏,选择前景色的颜…查看详情

4家不同的分销系统测评推荐

在做生意上面和公司上,公司的营销对于公司说是一件非常重要的事情。产品的供应和经销商是出售商品的关键,在这个上面就需要用到我们现在比较流行的分销系统。分销系统,对于公司和企业来说都是帮助公司出售产品的一个便捷的系统…查看详情

专利转让的税费怎么计算 专利转让的税费计算方法

  个人专利转让可国家和法律允许的,可以自由转让,不受他人或单位的限制。但是转让个人专利产生的个人收入是需要缴纳税费的,下面*就给大家来详细介绍一下专利转让的税费怎么计算  专利转让的税费计算方法这一块的相关内…查看详情

菜鸟驿站申请入口在哪?有什么条件?

  优质答案(1)  1、打开浏览器,搜索【菜鸟驿站】,点击进入官网。  2、点击【立即申请入驻】。  3、需要先登录淘宝网站。如果你没有的话,就先点击下方进行注册一个账号,按照提示操作即可  4、登录后认真读取界面的内…查看详情

window10正式版多少钱

  作为目前最新的操作系统,Windows10正式版价格各个国家和地区会有所不同。在中国大陆地区,Windows10正式版家庭版售价为899元,专业版为1999元,教育版和企业版则需要咨询微软官方渠道获取报价。  相比起之前的Windows...查看详情

优秀的商会网站建设,要有需求分析、网站目标和原则

商会网站建设,是商会利用互联网建立一个属于自己的网站平台、推广商会形象、传递商会信息,进行商会活动。现如今,也越来越多的商会利用起互联网这一工具,想要进一步扩大自己的商会规模。但如今已搭建商会网站的、正在搭建商会…查看详情

电商怎么做营销推广 电商营销推广方法

  近些年是电商最火爆的阶段,对于电商企业来说,要怎么做市场营销呢?从本质上来说,电商企业最主要还是要依赖网络营销,在运作网络营销的同时,也要运作市场营销,关于这个部分的工作,下面*就给大家来分享一下电商怎么做营销…查看详情

如何注销自己名下公司(附详细注销流程)

  注册完公司却不想做了,能注销吗?  *来回答:可以注销。但是也需要像注册公司一样,材料是要齐全的,而且税务和工商需要在正常的状态之下才能够进行注销。  虽然说现在注册公司门槛很低,但是对于第一次创业的小伙伴来说…查看详情

商业管理软件有哪些-商业管理系统哪个好用

对于一些商企来说,他们平时需要接很多任务,并且还要在规定时间内完成,但是,面对这么多任务难免会出现混乱的情况,那么,我们可以很好的借助商业管理软件去管理好这些业务。1、奥凯小商通是一款面对中小型商业企业的信息管理软…查看详情

基础内容介绍 | 商标好注册吗?

商标好注册吗?相信这是大多想要注册商标或准备注册商标的企业和个人都想知道的问题。商标是否好注册,我们可以从它的注册要求、所需资料、申请流程、审核时间等方面来进行判断,不妨接着往下看。图片来源于网络 ▍  商…查看详情

偷偷的告诉你,你的同事都在用这些软件做全景图!

对于装修公司来说,是必须要具备全景图制作软件的,因为,当按照客户的要求做出效果图后,只有用全景图才可以让客户感觉出做出来的效果好不好,这样才能确保后期客户的满意度。1、Pano2VR全景图像转化生成软件是一款全景图转化制作软…查看详情

3款好用的家庭理财软件,非专业人士也能轻松理财

对于有钱人来说,他为什么会有钱,主要是因为他所做的项目是特别大的,其次就是他会理财,理财是一个很专业的事情,如果你会理财的话,那么很有可能你就从中能赚到钱,关于家庭理财软件都有什么呢?1、懒猫投资理财它是一款很好用…查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询