首页 >知识讲堂 >数据分析知识>如何通过用户历史行为数据建立信用评分模型?

如何通过用户历史行为数据建立信用评分模型?

2021-01-05 10:27:53 阅读(288 评论(0)

摘要:面向小微企业和个人消费的小微信贷是当前互联网金融的重要发展方向,正在经历爆炸性增长。在这个增长过程中,如何通过互联网大数据分析实现快速准确的信用信息,没有实物抵押,是一个非常重要的问题。为此,不同的数据来源将为信用评估提供依据。本文将对用户的历史行为数据进行分析和讨论,建立信用评分模型,并通过该模型提高信用评估的预测效果。1、业务介绍行业介绍小微信贷,我们将其定义为金额小、无抵押担保、完全依赖信用的贷款行为。小微信贷可以面向个人(2C)或小微企业(2B)。对于2C业务,通常是小额短期信用贷款,这是一种人民币信用贷款,用于解决借款人的临时消费需求,期限不到一年,金额不到20万元,无需担保。对于2B业务,由于小微企业的信贷需求特点是“短、小、频、急”,这种小、短、分散的特点更类似于零售贷款,对资本流动性的要求更高。小额信贷的产生有其深刻的市场原因。在2B层面,小微企业受到传统金融机构的歧视和排斥,资金供给严重不足最终导致小微企业营养不良。主要原因是小微企业抵押品不足。传统的银行贷款往往需要企业提供足够的抵押品。小微企业正处于发展的初级阶段,刀口必须使用有限的资金,因此只有少量资金可用于购买土地、房地产等固定资产。因此,传统银行在小微业务中产品较少。这导致小微企业的融资需求与银行产品不匹配。另一方面,许多小微企业的财务报表不完整,导致信息不对称。银行对他们了解不够,不敢轻易借钱。事实上,对于银行来说,与大企业相比,小微信贷业务的成本更高,这也导致了银行贷款动力的不足。相反,在互联网平台上,信息不对称性在一定程度上降低,资本供需双方在降低交易成本的同时直接对接,一些电子商务平台也开始为平台上的中小企业提供融资信贷服务。图1银行的大企业贷款和小微企业贷款为2C。个人信用贷款主要用于购车、房屋装修、旅游等消费,但一般不能用于支付购房款。一般来说,信用良好、固定住所、收入稳定、还款能力充足的人可以申请信用贷款。传统的信用审计仍存在效率低、速度慢、准确性差等缺点。由于这些问题,很难适应互联网信贷的审计模式。另一方面,对于普通大众来说,信用卡可以控制的信用额度是有限的。所以,仅仅依靠现有的金融产品并不能满足用户对贷款金额及时性的细化需求。网络信贷的出现将更快地匹配这一过程,从而大大降低时间成本。自余额宝推出以来,互联网金融产品如雨后春笋般涌现。移动互联网正逐渐渗透到传统金融的各个环节,旨在使金融能够以更低的成本、更多样化的方式和更好的体验覆盖更多的人。网络信用平台通过互联网对小额信用贷款进行了改造,使更多的小微企业和个人有了融资渠道,这一过程变得更加便捷。由于小额贷款中的贷款没有抵押和担保,唯一依赖的是个人或企业的信用,因此信用调查过程非常重要。我们*的是如何利用互联网平台的大量信息来帮助我们快速准确地完成这个过程。马云在给阿里巴巴员工的一封内部邮件中表示,以控制为出发点的IT时代正在激活生产力(datatechnology)数据时代。随着计算机技术的发展,基于大数据应用服务的大数据运算变得越来越现实。大数据在营销领域的应用将广告转化为“窄告”精准营销,在互联网金融普及的背景下,大数据在金融业信用调查中的应用也在逐渐兴起。2015年1月5日,中国人民银行发布《关于准备个人信用调查业务的通知》,公布了首批获得个人信用调查许可证的8家机构名单,这八家机构有:腾讯信用调查有限公司、芝麻信用管理有限公司、深圳前海信用调查中心有限公司、鹏源信用调查有限公司、中成信用调查有限公司、中成信用调查有限公司、拉卡拉信用管理有限公司、北京华道信用调查有限公司。央行信用调查中心是一个基本数据库,已批准的个人信用调查机构将提供一些增值和创新服务。中央银行的信用调查中心是一个基本数据库,批准的个人信用调查机构将提供一些增值和创新服务。因此,在信用调查平台上,各行各业的英雄将使用自己的数据来展示自己的魔力。如何在B2C或P2P平台上使用大量互联网数据来帮助完成信用调查的过程,是我们今天希望在互联网上不断颠覆传统的东西。本研究的目的是通过收集到的用户历史行为数据,建立一个预测用户信用评分的模型。本文的数据收集来自一家小型贷款公司。为了数据隐私,本文将隐藏部分数据信息和分析结果,但不影响分析结果的客观性。具体来说,我们称提供数据的公司为熊小贷(匿名),其业务包括2B业务和2C业务。通过自身的综合数据分析,公司对2B和2C业务获得了统一的用户信用评分,称为熊评分。然而,熊的得分广泛针对公司的所有产品和用户,因此对特定产品的信用评分对用户违约的预测精度不高。熊小额贷款公司希望通过产品用户独特信息的数据支持,为特定产品建立用户信用评分模型。预期目标是通过数据支持建立的产品用户信用评分模型,预测用户是否违约的准确性高于通用熊评分。从图3可以直观地了解公司的2B和2C业务,包括不同用户的不同产品。例如,熊分期付款是为熊得分超过400分的用户定制的产品。在手机客户端下载APP“熊小贷”,点击进入即可开始信用生活。然后点击“熊分期付款”进入产品页面,用户将被要求注册并填写个人信息。图3熊小额贷款公司的产品概况将根据收集到的用户信息建立信用评分模型,匹配公司数据库中的用户交易行为信息,以及使用“熊分期付款”产品贷款的用户的违约。这种信用模式将从业务目标和业务背景出发。该模型以预测用户信用评分为参考,并直接指导业务层面是否可以向用户发放贷款。第二章将重点介绍具体的数据采集和变量清理过程,第三章将介绍模型建立。二、数据描述数据收集熊小额贷款公司股东有第三方支付渠道,可以通过银行卡收集独特的用户交易信息,注册用户只要通过第三方支付渠道交易,可以记录,通过用户手机号码,可以搜索用户的历史交易行为数据。该数据源具有其独特的优势,直接避免了传统信用调查行业用户自填数据的重大问题:a.对个人或企业进行评级刻画时,维度相对单一,无法获得全面的立体评级;b.伪造财务数据的可能性更大,如工资自填。如果用户夸大了公司的水平,以获得贷款审批,小额贷款公司很难确认;c.交叉验证缺乏其他数据,降低评级的可靠性。但熊小贷公司收集的数据比传统数据丰富得多。然而,熊小额贷款公司收集的数据比传统数据要丰富得多。熊小额贷款公司收集了上述产品“熊分期付款”对应的注册用户信息近3万条,自注册应用程序以来的总交易量近450万行,以及相应的其他信息。这些交易信息的时间间隔超过一年。其中违约用户近1万,非违约用户近2万。值得注意的是,为模型建立的抽样数据并不意味着实际注册用户中违约用户与非违约用户的比例。具体而言,熊小额贷款公司“熊分期付款”产品对应的注册用户数据结构主要包括以下四种表格,即交易事实表、用户信息表、商户分类信息表和银行卡信息表。它们之间的关系如图4所示。这四张表格分别通过不同的关键字连接,具体如下:a.用户信息表可以对应用户的手机号码和交易事实表,一个用户的手机号码对应多个交易事实记录;b.商户分类信息表可通过商户编号和交易事实表对应,一个商户号可能会产生多个交易事实;c.银行卡信息表可以通过银行卡的前几位数字(称为卡标首)对应交易事实表中的卡号。四张表格中包含的具体变量信息如下:用户信息表:手机号码、注册渠道(手机APP注册或网站注册)、身份证(提供的数据已加密)、提取数据前的最新登录时间、注册时间等。商户分类信息表:创建时间、商户号、商户名、商户1级分类代码、商户1级分类代码、商户2级分类代码、商户3级分类代码、商户3级分类代码、商户4级分类代码、商户4级分类代码等。银行卡信息表(银行卡类型信息):卡标头(银行卡的前几位数据决定了属于哪家银行的卡类型)、首长(例如,如果前六位数字决定了卡类型,则首长为6)、账户类型、账户类型名称(如储蓄卡或信用卡)、卡代码、银行代码、银行名称等。交易事实表:自来水号码(每笔交易将设置自来水号码)、交易手机号码、交易时间、商户号码、账单号、支付金额(支付金额等于账单金额加费用总额)、账单金额、手续费等。综上所述,上述四种表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。综上所述,上述四个表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。图4熊分期付款产品用户数据结构数据清理变量收集首先,根据关键字合并所有四个表格。每个观测行数接近450万条,包括用户个人信息、银行卡信息、商户分类信息等。直接处理不是一个很好的解决方案,因此产生的数据量太大,不直观地有利于分析。我们的目标是将所有信息汇总给每个用户,并定义用户的衍生变量。因此,我们将用户特征分为两个方向,即用户基本信息变量和用户分类信息变量。接下来,我们将详细定义它。用户基本信息变量生成的用户基本信息变量包括可以直接从数据中收集的变量和衍生变量,如下所示:(1)用户熊得分:由于原始综合熊得分预测精度的目标,我们将“熊得分”作为解释变量进入模型,“熊得分”是熊贷款公司业务人员根据实际业务定义指标系统生成的得分,我们认为它有一定的业务经验和背景知识,所以它也有很强的预测能力。熊得分越低,违约的可能性就越大。熊得分越低,违约的可能性就越大。(2、3)用户性别、用户年龄:用户性别、年龄信息可以通过用户身份证号码提取。我们通过与熊小额贷款公司的沟通完成了这些数据,熊小额贷款公司并没有直接提供用户的身份证号码。所获得的身份证信息均为加密信息。(4)用户注册年龄:即用户从第一次有交易记录开始,以天为单位。(5)交易数量:用户从第一笔交易记录开始,记录的交易总数。(6)所有行为的平均值:用户记录的所有交易行为的平均金额。(7)所有行为的最大值:用户从第一笔交易开始,所有交易行为的最大值。该指标可以衡量用户的极端行为。直观地说,用户的极端行为越大,违约的可能性就越大。(8)贷款比率:在用户的所有行为中,使用信用卡(或信用卡)的交易次数占使用信用卡或借记卡(或储蓄卡)的所有交易次数的比率。这一指标衡量了用户的交易习惯。例如,有些人习惯于直接使用储蓄卡消费,而另一些人则习惯于每月使用信用卡消费,然后在还款日按时还款,这样他们就可以在不影响每月财务计划的情况下消费。这两种消费习惯的用户群体是不同的。(9)银行卡数量:我们每个人需要的银行卡数量不多,银行卡太多的用户不同于正常用户群体。举例来说,如果需要多张信用卡消费,但是没有信用卡的人更容易违约。通过以上信息,我们定义了上述9个用户的基本信息变量。在信用调查问题中,用户分类信息变量和RFM模型通常面临一个典型的问题,在这种情况下也是如此。当用户对应多种行为关系时,如何根据一套既定的指标系统对个人进行总结?在这种情况下,每个用户对应的交易记录从几十到一千不等。我们可以将其归类为不同类型的交易,如在超市购物、购买游戏卡、支付水、电、气费等。对应每一类行为,都需要以标准化的方式计算对应每个人的变量,以衡量对应一系列行为的人的特征。为此,我们介绍了营销中常用的RFM模型(见美国数据库营销研究所Arthurhughes的研究)。在营销领域,RFM模型是衡量客户价值和创利能力的重要工具和手段。该模型通过三个指标来描述客户的综合价值:最近的购买行为、购买的总体频率和花费多少钱,具体如下:(1)R(Recency),最后一次消费是指从最后一次购买到现在的距离。理论上,最后一次消费时间越近的用户应该是相对活跃的用户。因此,这些用户最有可能对提供即时商品或服务做出反应。我们通常会发现,用户在0到6个月内收到营销人员超过31到36个月的沟通信息。(2)

以上就是关于如何通过用户历史行为数据建立信用评分模型?的相关介绍,更多如何通过用户历史行为数据建立信用评分模型?相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对如何通过用户历史行为数据建立信用评分模型?有更深的了解和认识。

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

如何保护专利权 专利权保护方法

    在平时很多的小伙伴都不知道如何保护专利权的基本情况,而且对如何保护专利权都不是很熟悉,下面万商云集*就为大家整理了如何保护专利权这方面的相关内容,希望下面的内容能帮助到各位。    一、专利权保护方法  1、…查看详情

朋友圈推广有哪些方式

朋友圈推广是一种通过社交媒体平台中的个人或者个人账号来宣传和推广产品、服务或品牌的方式。下面将介绍一些朋友圈推广的常见方式。 1.发布优质内容:发布有趣、有用、有价值的内容是吸引朋友圈用户*的关键。可以分享精美图片…查看详情

怎么快速申请发明专利 快速申请发明专利技巧

    专利发明是特别重要的,而且申请的难度还算是非常大的,。那么在相关规定中,如何能快速申请发明专利呢?下面万商云集*就给大家来来介绍以下怎么快速申请发明专利  快速申请发明专利技巧这方面的内容,希望能帮助到…查看详情

怎样才能帮自己选到好的项目管理系统

项目管理系统是经常用到的,尤其是很多的企业在进行公司管理或者是进行项目管理的时候,都会选择一些比较好的管理系统来使用,但是选择的系统不同价格也是不同的,所以说在选择之前应该要知道项目管理系统报价单的情况,这样才能…查看详情

怎样制作微信小程序?相关步骤要知道

微信小程序使用率是比较高的,尤其是在最近几年越来越火,有很多的线下商家相信也都是了解的,甚至有很多的企业想要制定自己的小程序,这样才能够将自己的产品展现出去,也能够吸引更多的客户。但是在进行微信小程序定制的时候,…查看详情

哪款剪辑视频软件好用?这几个软件让视频剪辑不再难

不少人在生活中,都比较喜欢拍短视频来分享自己的生活,但想要获得优质的内容,还需要通过一些软件进行剪辑和修改,也涉及到了剪辑视频软件的使用,而在下面所介绍的几款剪辑视频的软件,可以让大家轻松上手。1、柚子视频录制柚子…查看详情

6款广泛用于教学的自动录播系统,大大节省时间

说道自动录播在现如今也是比较重要的过程,无论在工作中还是生活中都是必不可少的存在,比如,在教学中,可以完整的记录教师授课的过程,在企业中,也可以完整的记录领导在开会时所讲述的事情,那么今天我们就来盘点一下自动录播…查看详情

ipad怎么截屏? ipad截屏的几种方法

  优质答案(1)  这里提供两种方法,  方法一,点击小白点,选择屏幕快照即可截屏。  方法二,同时按住关机键和home键也可进行截屏。  扩展内容:iPad是由苹果公司于2010年开始发布的平板电脑系列,定位介于苹果的智能手机i…查看详情

4款超好用音频编辑工具,给你带来完美后期音频处理体验!

随着互联网的发展以及人们爱美意识的增强,越来越多的音频软件层出不穷。人们对于自己的声音有着极大的追求,有的要求甜美,有的要求御姐音,各种各样的只能由音频软件来满足广大人的需求。下面就由*来给大家整理一下音频软件哪个…查看详情

抢购软件哪个好?

现在大家都喜欢在网上购物,因为网上的东西是厂家直售的,要比线下的实体店便宜的多,所以,大家在网上购物的时候,也会选择很多优惠券或者砍价的形式把价格压到最低,那么,淘宝抢购软件有什么?1、券划算券划算海外购权利是一款…查看详情

在计算机系统中,操作系统是什么

windows7三种类型用户账户是什么账户可以完全控制计算机中所有资源?设置用户账户之前需要先弄清楚Windows7有几种账户类型。一般来说,Windows7的用户账户有以下3种类型。一、管理员账户:计算机的管理员账户拥有对全系统的控制权,...查看详情

刺激的匿名聊天软件app 匿名刺激聊天交友软件

最近几年匿名聊天社交软件算是很火的一种新的聊天方式,下面万商云集*就给大家来详细介绍一下刺激的匿名聊天软件app  匿名刺激聊天交友软件这方面的内容,希望能在社交软件这一块帮助到大家。  1、闪说闪说App &...查看详情

html语言是什么

html语言基本结构讲解?完整的HTML文件包括标题、段落、列表、表格、绘制的图形以及各种嵌入对象,这些对象统称为HTML元素。HTML5文件的基本结构:html语言是描述文档结构的语言对吗?HTML(HyperTextMark-upLan...查看详情

mac怎么卸载软件 mac卸载软件教程

  电脑太多不需要的软件,一般我们都会直接给它卸载。有的朋友可能不熟悉mac电脑不知道如何卸载软件,这里就和大家分享一下方法吧。下面*就就给大家来详细介绍一下mac怎么卸载软件  mac卸载软件教程这一块的相关内容,希望...查看详情

internet临时文件可以清理吗

windows-ssd临时文件哪些可以清理?临时文件顾名思义就是一些临时存储的文件当然可以删除可能是文档打开时的暂存,或者是internet页面的暂存,或者是下载什么东东的暂存,也可能是安装软件或者补丁的临时文件。。。datae盘什么文件可...查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询