首页 >知识讲堂 >数据分析知识>如何通过用户历史行为数据建立信用评分模型?

如何通过用户历史行为数据建立信用评分模型?

2021-01-05 10:27:53 阅读(284 评论(0)

摘要:面向小微企业和个人消费的小微信贷是当前互联网金融的重要发展方向,正在经历爆炸性增长。在这个增长过程中,如何通过互联网大数据分析实现快速准确的信用信息,没有实物抵押,是一个非常重要的问题。为此,不同的数据来源将为信用评估提供依据。本文将对用户的历史行为数据进行分析和讨论,建立信用评分模型,并通过该模型提高信用评估的预测效果。1、业务介绍行业介绍小微信贷,我们将其定义为金额小、无抵押担保、完全依赖信用的贷款行为。小微信贷可以面向个人(2C)或小微企业(2B)。对于2C业务,通常是小额短期信用贷款,这是一种人民币信用贷款,用于解决借款人的临时消费需求,期限不到一年,金额不到20万元,无需担保。对于2B业务,由于小微企业的信贷需求特点是“短、小、频、急”,这种小、短、分散的特点更类似于零售贷款,对资本流动性的要求更高。小额信贷的产生有其深刻的市场原因。在2B层面,小微企业受到传统金融机构的歧视和排斥,资金供给严重不足最终导致小微企业营养不良。主要原因是小微企业抵押品不足。传统的银行贷款往往需要企业提供足够的抵押品。小微企业正处于发展的初级阶段,刀口必须使用有限的资金,因此只有少量资金可用于购买土地、房地产等固定资产。因此,传统银行在小微业务中产品较少。这导致小微企业的融资需求与银行产品不匹配。另一方面,许多小微企业的财务报表不完整,导致信息不对称。银行对他们了解不够,不敢轻易借钱。事实上,对于银行来说,与大企业相比,小微信贷业务的成本更高,这也导致了银行贷款动力的不足。相反,在互联网平台上,信息不对称性在一定程度上降低,资本供需双方在降低交易成本的同时直接对接,一些电子商务平台也开始为平台上的中小企业提供融资信贷服务。图1银行的大企业贷款和小微企业贷款为2C。个人信用贷款主要用于购车、房屋装修、旅游等消费,但一般不能用于支付购房款。一般来说,信用良好、固定住所、收入稳定、还款能力充足的人可以申请信用贷款。传统的信用审计仍存在效率低、速度慢、准确性差等缺点。由于这些问题,很难适应互联网信贷的审计模式。另一方面,对于普通大众来说,信用卡可以控制的信用额度是有限的。所以,仅仅依靠现有的金融产品并不能满足用户对贷款金额及时性的细化需求。网络信贷的出现将更快地匹配这一过程,从而大大降低时间成本。自余额宝推出以来,互联网金融产品如雨后春笋般涌现。移动互联网正逐渐渗透到传统金融的各个环节,旨在使金融能够以更低的成本、更多样化的方式和更好的体验覆盖更多的人。网络信用平台通过互联网对小额信用贷款进行了改造,使更多的小微企业和个人有了融资渠道,这一过程变得更加便捷。由于小额贷款中的贷款没有抵押和担保,唯一依赖的是个人或企业的信用,因此信用调查过程非常重要。我们关注的是如何利用互联网平台的大量信息来帮助我们快速准确地完成这个过程。马云在给阿里巴巴员工的一封内部邮件中表示,以控制为出发点的IT时代正在激活生产力(datatechnology)数据时代。随着计算机技术的发展,基于大数据应用服务的大数据运算变得越来越现实。大数据在营销领域的应用将广告转化为“窄告”精准营销,在互联网金融普及的背景下,大数据在金融业信用调查中的应用也在逐渐兴起。2015年1月5日,中国人民银行发布《关于准备个人信用调查业务的通知》,公布了首批获得个人信用调查许可证的8家机构名单,这八家机构有:腾讯信用调查有限公司、芝麻信用管理有限公司、深圳前海信用调查中心有限公司、鹏源信用调查有限公司、中成信用调查有限公司、中成信用调查有限公司、拉卡拉信用管理有限公司、北京华道信用调查有限公司。央行信用调查中心是一个基本数据库,已批准的个人信用调查机构将提供一些增值和创新服务。中央银行的信用调查中心是一个基本数据库,批准的个人信用调查机构将提供一些增值和创新服务。因此,在信用调查平台上,各行各业的英雄将使用自己的数据来展示自己的魔力。如何在B2C或P2P平台上使用大量互联网数据来帮助完成信用调查的过程,是我们今天希望在互联网上不断颠覆传统的东西。本研究的目的是通过收集到的用户历史行为数据,建立一个预测用户信用评分的模型。本文的数据收集来自一家小型贷款公司。为了数据隐私,本文将隐藏部分数据信息和分析结果,但不影响分析结果的客观性。具体来说,我们称提供数据的公司为熊小贷(匿名),其业务包括2B业务和2C业务。通过自身的综合数据分析,公司对2B和2C业务获得了统一的用户信用评分,称为熊评分。然而,熊的得分广泛针对公司的所有产品和用户,因此对特定产品的信用评分对用户违约的预测精度不高。熊小额贷款公司希望通过产品用户独特信息的数据支持,为特定产品建立用户信用评分模型。预期目标是通过数据支持建立的产品用户信用评分模型,预测用户是否违约的准确性高于通用熊评分。从图3可以直观地了解公司的2B和2C业务,包括不同用户的不同产品。例如,熊分期付款是为熊得分超过400分的用户定制的产品。在手机客户端下载APP“熊小贷”,点击进入即可开始信用生活。然后点击“熊分期付款”进入产品页面,用户将被要求注册并填写个人信息。图3熊小额贷款公司的产品概况将根据收集到的用户信息建立信用评分模型,匹配公司数据库中的用户交易行为信息,以及使用“熊分期付款”产品贷款的用户的违约。这种信用模式将从业务目标和业务背景出发。该模型以预测用户信用评分为参考,并直接指导业务层面是否可以向用户发放贷款。第二章将重点介绍具体的数据采集和变量清理过程,第三章将介绍模型建立。二、数据描述数据收集熊小额贷款公司股东有第三方支付渠道,可以通过银行卡收集独特的用户交易信息,注册用户只要通过第三方支付渠道交易,可以记录,通过用户手机号码,可以搜索用户的历史交易行为数据。该数据源具有其独特的优势,直接避免了传统信用调查行业用户自填数据的重大问题:a.对个人或企业进行评级刻画时,维度相对单一,无法获得全面的立体评级;b.伪造财务数据的可能性更大,如工资自填。如果用户夸大了公司的水平,以获得贷款审批,小额贷款公司很难确认;c.交叉验证缺乏其他数据,降低评级的可靠性。但熊小贷公司收集的数据比传统数据丰富得多。然而,熊小额贷款公司收集的数据比传统数据要丰富得多。熊小额贷款公司收集了上述产品“熊分期付款”对应的注册用户信息近3万条,自注册应用程序以来的总交易量近450万行,以及相应的其他信息。这些交易信息的时间间隔超过一年。其中违约用户近1万,非违约用户近2万。值得注意的是,为模型建立的抽样数据并不意味着实际注册用户中违约用户与非违约用户的比例。具体而言,熊小额贷款公司“熊分期付款”产品对应的注册用户数据结构主要包括以下四种表格,即交易事实表、用户信息表、商户分类信息表和银行卡信息表。它们之间的关系如图4所示。这四张表格分别通过不同的关键字连接,具体如下:a.用户信息表可以对应用户的手机号码和交易事实表,一个用户的手机号码对应多个交易事实记录;b.商户分类信息表可通过商户编号和交易事实表对应,一个商户号可能会产生多个交易事实;c.银行卡信息表可以通过银行卡的前几位数字(称为卡标首)对应交易事实表中的卡号。四张表格中包含的具体变量信息如下:用户信息表:手机号码、注册渠道(手机APP注册或网站注册)、身份证(提供的数据已加密)、提取数据前的最新登录时间、注册时间等。商户分类信息表:创建时间、商户号、商户名、商户1级分类代码、商户1级分类代码、商户2级分类代码、商户3级分类代码、商户3级分类代码、商户4级分类代码、商户4级分类代码等。银行卡信息表(银行卡类型信息):卡标头(银行卡的前几位数据决定了属于哪家银行的卡类型)、首长(例如,如果前六位数字决定了卡类型,则首长为6)、账户类型、账户类型名称(如储蓄卡或信用卡)、卡代码、银行代码、银行名称等。交易事实表:自来水号码(每笔交易将设置自来水号码)、交易手机号码、交易时间、商户号码、账单号、支付金额(支付金额等于账单金额加费用总额)、账单金额、手续费等。综上所述,上述四种表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。综上所述,上述四个表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。图4熊分期付款产品用户数据结构数据清理变量收集首先,根据关键字合并所有四个表格。每个观测行数接近450万条,包括用户个人信息、银行卡信息、商户分类信息等。直接处理不是一个很好的解决方案,因此产生的数据量太大,不直观地有利于分析。我们的目标是将所有信息汇总给每个用户,并定义用户的衍生变量。因此,我们将用户特征分为两个方向,即用户基本信息变量和用户分类信息变量。接下来,我们将详细定义它。用户基本信息变量生成的用户基本信息变量包括可以直接从数据中收集的变量和衍生变量,如下所示:(1)用户熊得分:由于原始综合熊得分预测精度的目标,我们将“熊得分”作为解释变量进入模型,“熊得分”是熊贷款公司业务人员根据实际业务定义指标系统生成的得分,我们认为它有一定的业务经验和背景知识,所以它也有很强的预测能力。熊得分越低,违约的可能性就越大。熊得分越低,违约的可能性就越大。(2、3)用户性别、用户年龄:用户性别、年龄信息可以通过用户身份证号码提取。我们通过与熊小额贷款公司的沟通完成了这些数据,熊小额贷款公司并没有直接提供用户的身份证号码。所获得的身份证信息均为加密信息。(4)用户注册年龄:即用户从第一次有交易记录开始,以天为单位。(5)交易数量:用户从第一笔交易记录开始,记录的交易总数。(6)所有行为的平均值:用户记录的所有交易行为的平均金额。(7)所有行为的最大值:用户从第一笔交易开始,所有交易行为的最大值。该指标可以衡量用户的极端行为。直观地说,用户的极端行为越大,违约的可能性就越大。(8)贷款比率:在用户的所有行为中,使用信用卡(或信用卡)的交易次数占使用信用卡或借记卡(或储蓄卡)的所有交易次数的比率。这一指标衡量了用户的交易习惯。例如,有些人习惯于直接使用储蓄卡消费,而另一些人则习惯于每月使用信用卡消费,然后在还款日按时还款,这样他们就可以在不影响每月财务计划的情况下消费。这两种消费习惯的用户群体是不同的。(9)银行卡数量:我们每个人需要的银行卡数量不多,银行卡太多的用户不同于正常用户群体。举例来说,如果需要多张信用卡消费,但是没有信用卡的人更容易违约。通过以上信息,我们定义了上述9个用户的基本信息变量。在信用调查问题中,用户分类信息变量和RFM模型通常面临一个典型的问题,在这种情况下也是如此。当用户对应多种行为关系时,如何根据一套既定的指标系统对个人进行总结?在这种情况下,每个用户对应的交易记录从几十到一千不等。我们可以将其归类为不同类型的交易,如在超市购物、购买游戏卡、支付水、电、气费等。对应每一类行为,都需要以标准化的方式计算对应每个人的变量,以衡量对应一系列行为的人的特征。为此,我们介绍了营销中常用的RFM模型(见美国数据库营销研究所Arthurhughes的研究)。在营销领域,RFM模型是衡量客户价值和创利能力的重要工具和手段。该模型通过三个指标来描述客户的综合价值:最近的购买行为、购买的总体频率和花费多少钱,具体如下:(1)R(Recency),最后一次消费是指从最后一次购买到现在的距离。理论上,最后一次消费时间越近的用户应该是相对活跃的用户。因此,这些用户最有可能对提供即时商品或服务做出反应。我们通常会发现,用户在0到6个月内收到营销人员超过31到36个月的沟通信息。(2)

以上就是关于如何通过用户历史行为数据建立信用评分模型?的相关介绍,更多如何通过用户历史行为数据建立信用评分模型?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对如何通过用户历史行为数据建立信用评分模型?有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

与传统的手工做账方式相比,财务软件优势有哪些?

近些年来,科学技术水平在快速发展,高科技产品数量在不断增多。尤其是互联网技术,可谓是发展十分迅速,应用非常广泛。越来越多的企业,在日常的经营过程当中,则会使用到财务软件。那么,通过对财务软件的使用,对财务人员来说…查看详情

设计图制作软件哪些功能强大呢?试试这几款吧。

对于美工设计师来说,想要设计出一款好的图片,需要有强大的基础功底,同时也要拥有一个好用的软件工具,这样才可以增加工作的效率。而好的设计图制作软件,需要拥有强大的功能和更强的专业性,帮助设计师快速制作出图片,那么设…查看详情

注册一个小公司的流程 2022注册公司流程

  现在很多的人都对注册公司不是很熟悉,不熟悉注册公司的流程以及注册公司的相关所需材料,下面小编就给大家来详细介绍一下注册一个小公司的流程 2022注册公司流程这一块的内容,希望能帮助到大家了解到这一块的内容。  注…查看详情

自己如何注销公司(附上详细注销流程)

  自己注销的话,会产生相关的工本费用,几百不等。带其实注销是个费时费力的事情,下面小编给大家来详细介绍一下自己如何注销公司这一块的内容,希望能帮助到大家解决这一块的相关问题。  自己如何注销公司  公司注销其主…查看详情

linux卸载软件包命令

Linux下软件安装与卸载的方法命令?1、您可以使用“dpkg”命令来查看您的计算机,按“Ctrl+Alt+T”的所有已安装包的列表,打开一个终端窗口。在提示符下键入以下命令,然后按Enter键。dpkg--list。2、滚动安装的软件包在...查看详情

小程序怎么分享朋友圈

  怎么把商家小程序发到朋友圈?  如果您是微信小程序商家,想要分享自己的小程序到朋友圈,可以按照以下步骤操作:  1.打开您的小程序,找到小程序首页或者想要分享的页面。  2.在右下角找到“分享”按钮,点击进入分享界面…查看详情

网站设计十大常识性错误,你触犯了吗?

想要打造一个完美的网站,并不单纯只是按照相应的规则,其中也有一些设计的技巧,而不只是天马行空,在设计网站的时候,更要杜绝毫无顾忌,需要了解这些常识性的错误,才能够往优秀网站的道路上更进一步,那么网站设计十大常识性…查看详情

2022年线上可以做的引流方法

现在在互联网的大环境下,任何行业都是可以在线上实现成交和引流的,但是很多的企业都不知道怎么做好引流,下面万商云集小编给大家来介绍下2022年线上可以做的引流方法。  01评论引流法  就是去⼀些热⻔内容⾥⾯,留下⾃⼰的评…查看详情

2022年如何制作手机app软件

大家应该都很想自己制作一个软件供自己使用吧,那么我就给大家介绍一下2022年如何制作手机app软件,保证不是没用的烂软件,都是免费且经过好评的,希望我的文章可以帮助到你选择适合自己的软件。1.网络转换appfusionapp是一款非常好用的...查看详情

2021年视频播放软件排行前十大盘点

随着科技的迅速发展,手机将我们连成一个整体,生活中看不到的东西都可以通过视频软件看到,我们的生活也能分享给别人,接下来给大家分享2021视频软件排行前十。1.抖音抖音是中国互联网十大品牌之一的字节跳动推出的颇负盛名的音乐…查看详情

万商云集2019品牌服务大使候选人专访之——西安团队李维娟

在万商云集西安分公司客户代表——李维娟看来,服务客户不仅是好态度、快回应,更多的是“要主动去督促客户”,把客户还没想到或者忽略的事情挂在心上。在万商云集西安分公司庞大的客服体系中,李维娟无论是资历还是从专业上都是…查看详情

3款既能播放音乐又能播放电视剧的万能播放器

其实万能播放器要比普通的音乐播放器更加好用一些,而且他的功能非常全,不仅可以播放音乐,同时还可以播放电视剧,所以如果你的手机内存比较满的话,直接下载一个万能播放器就可以了。1、PotPlayer它是一款韩国流行、深受欢迎的视频…查看详情

注册商标多少类?一共45类,可按需要注册,也可全部注册

注册商标,首先我们要知道商标类别是指《类似商品或服务区分表》,是一本国际上通用的商标分类书,也就是说,无论去哪个国家注册商标,都要参考并按照商品所在的位置选择商标类别,然后进行注册。那么注册商标多少类呢?下面一起…查看详情

医院固定资产管理软件你了解吗?

医院要想良好的发展,避免不了会涉及到医院资产的有效管理。对于那些医疗设备密集型医院,固定资产管理更显得尤为重要。传统的固定资产管理模式无论从质量上还是效率上,都难以适应经营管理新形式的需要。为了医院的固定资产能充…查看详情

vimeo国内能用吗

mac下载工具?Mac是一款易于使用的视频下载工具,它不会因为大量的选项而让用户困扰-它使用起来非常简单。实测支持国内的优酷和土豆等,Downie还支持离线观看视频。peakvisor国内能用吗?不能用。国内专门做短片汇聚的app有开眼和V...查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询