本博文将针对消费贷款领域的信用评分及其模型进行相关研究探讨。虽然人人都可以通过对借款方在Lending Club(国外最大的P2P网站)和Prosper上的历史借贷数据进行分析,但我相信,了解消费信贷行为、评分机制和贷款决策背后的工作原理可以帮助投资人更好的在市场中进行决策,获得收益。

消费信贷一直是推动世界领先国家经济转型的主要力量。在过去的50年里,消费开支也因此有所增加。根据纽约联邦储备银行家庭债务和信用季度报告,2014年8月,消费者负债总额为11.63万亿美元,其中74%为按揭和净值贷款,10%为学生贷款,8%为汽车贷款,以及6%为信用卡债务。消费信贷需求增长率极高,自动化风险评估系统势在必行。

信用评分

信用评分最早始于上世纪50年代初。信用评分最初使用统计学方法来区分优秀和不良贷款。最初,信用评分的重点是是否要给贷方发放贷款,后来,这种行为转变成了申请人评分(applicant scoring)。信用评分借着申请人评分这一项成为了一项成功的评价系统。

在信用评分中,信贷价值假设会在未来的几年保持稳定,贷方会对申请人是否会在未来的12个月内出现90天以上的逾期支付进行评估。申请成功时的最低评分界限是该分值边际良好和不良贷款几率相比而来。申请者贷款1-2年以来的数据,加上相应的信用记录将帮助建立申请者未来2年左右的申请评分模型。

    行为评分(Behavioral scoring,是申请人评分的一个补充,旨在评估申请人在过去一年中支付和购买行为的状况。 此数据用于预测未来12个月的违约风险情况,通常每个月更新一次数据。最近表现和当前信贷信息比最开始的申请信息更为重要。比起违约风险,如今贷款方更加注重能满足他们盈利目标的贷款战略。他们通过选择贷款额、利率及其他条款,从而最大限度地提高盈利能力。基于盈利能力而做出决策的技术分析叫做利润评分(profitscoring)

与可使用静态信用评分模式的申请人评分不同,行为评分和利润评分需要使用动态信用评分模式,即要将过去的信贷行为纳入考虑范围。 一般来说,信用评分模型会分别为每一笔借贷建模。但是,如果借款人贷款组合违约情况(信用风险)增高,所借款项便不重要了。目前为止没有广泛接受的用于评估贷款组合的信用风险模型。我们可以通过评估系统识别贷款质量的能力,预测概率的精确性以及分类预测的准确性这三点来评估一个信用评分模型。

贷款决策模型

贷款人的主要目标是在其投资组合中获得利润最大化。对于任何一笔贷款中,投资人都需要考虑贷款回报额。投资100美元,获利10美元显然不如投资25美元,获得3美元回报。有些情况下,借款人无法偿还贷款,这就意味着贷款人甚至会面临重大损失。我们可以通过分析投资组合违约率及违约结果对风险进行量化。贷款人还可以将风险和回报设定在预期的范围内。最终是否投资给借款人需要基于一系列决策:即哪些信息将有助于作出决策,在决策过程期间和之后贷款会有何发展以及最终可能出现的结果。

影响图网

影响图网利用可视化的图形帮助投资人了解主要决策、不确定性因素以及最终成果是如何相互影响的。影响图网可以确定决策的重要方面,有哪些数据与决策相关,以及在哪些方面与决策有关。图网包括三种节点:决策(长方形节点),不确定因素(圆形节点),以及结果(菱形节点)。各节点由箭头相互连接。

图1从市场中贷款人的角度进行绘制。

在上图中我们看到:首先,贷款人获得借款人是否会有良好表现的贷款预测。预测是随机事件,贷款人也不能决定预测的结果。它影响的是否投资贷款(Loan or not)的决策,也会影响借款人的表现优劣(Borrower good or bad)。接着,平台将决定是否发布贷款(Loan issued or not)。这对贷款人来说是随机事件。只有该贷款得到足够的贷款人支持,贷款人对是否发布贷款才有决定权或影响力。贷款一旦发布,贷款人就可以检验收入证明(Income verification)执行情况,查看FICO分数及还款记录(FICO score and payment history.)的变化,并更新贷款预测。根据更新后的贷款预测,贷款人可以决定是否要在FILOfn二级交易平台上卖出贷款。类似的,其他贷款人也可以在二级交易平台上很据更新的贷款预测决定是否买入贷款。这一系列事件会最终影响贷款人的收益。

决策树

决策树确定贷款中有哪些最优决策,并按照决策过程中信息的了解顺序来解析决策的各个步骤。

那么决策树模型又是如何根据可视化影响图网中的结构逐渐形成的呢?决策树与影像图网的结构类似。其结果由以数字代表的回报事件表示。每个机会节点(不确定事件)都被赋予一定比重,比重代表事件结果发生的可能性。

从结果点开始往回推,经过所有决策及不确定事件的节点后,可以计算出每个结果的预期货币值(EMV)。

图2是一个简单的贷款决策的决策树。贷款人对是否进行投资做出了一份初期判断。如果贷款人不愿投资,则回报是0。如果贷款人投资,则有两种可能:投资回报良好,或不好(即违约)。

假设,借款人回报良好时,贷款人获益10,借款人违约时,贷款人则损失100。如果违约可能性是5%,并且贷款人愿意投资,则贷款人可能从借款人处获益:

0.95 x 10 + 0.05 x (-100) = 4.5

如果贷款人不愿投资,则获益为0。因此,决策树显示贷款人应该进行投资。如果违约的可能性增加到10%,则贷款人可能从借款人处获益:

0.90 x 10 + 0.10 x (-100) = -1

因此,决策树显示贷款人不应该进行投资。

综上所示,如果g代表贷款人收益,l代表因借款人违约导致的贷款人损失,p代表投资回报良好的可能性,那么根据预期货币值(EMV)的标准,只有 pg – (1-p)l > 0时,贷款人应该进行投资。

p/(1-p)即投资回报良好的可能性与违约可能性的比值,也称为良莠比(good:bad odds)

能够涵盖所有贷款决策的决策树很难实现,也不方便。但是,决策树可以协助贷款人进行决策。

信用评分及模型原理解析(以P2P网贷为例)的更多相关文章

  1. 以P2P网贷为例互联网金融产品如何利用大数据做风控?

    以P2P网贷为例互联网金融产品如何利用大数据做风控?   销售环节 了解客户申请意愿和申请信息的真实性:适用于信贷员模式. 风控关键点 亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位. 审 ...

  2. p2p网贷平台设计简析

    以我之前主持开发的一个商业产品:p2p网贷为例进行分析.整个的概况,可以参见:www.huixinp2p.com(目的只会技术交流) 界面可以直接参考前期博客:http://www.cnblogs.c ...

  3. 3分钟搞明白信用评分卡模型&模型验证

    信用评分卡模型在国外是一种成熟的预测方法,尤其在信用风险评估以及金融风险控制领域更是得到了比较广泛的使用,其原理是将模型变量WOE编码方式离散化之后运用logistic回归模型进行的一种二分类变量的广 ...

  4. 基于Python的信用评分卡模型分析(二)

    上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...

  5. WOE:信用评分卡模型中的变量离散化方法(生存分析)

    WOE:信用评分卡模型中的变量离散化方法 2016-03-21 生存分析 在做回归模型时,因临床需要常常需要对连续性的变量离散化,诸如年龄,分为老.中.青三组,一般的做法是ROC或者X-tile等等. ...

  6. 带你认识“货真价实”的P2P网贷风控

      文/杨帆 说起P2P,多数金融圈内人士已经并不陌生.国内现有近千家的P2P网贷平台,动辄打出高息诱人的收益率宣传口号以及眼花缭乱的安全承诺.但是在这些浮华表面的背后,关于P2P的风控很多人仍然是一 ...

  7. 余额宝 vs. P2P网贷,谁更有生命力?

    余额宝跟P2P网贷作为一个理财方式,要说谁更有生命力,那就必须从以下几个方面说起,一是收益性,二是风险性,三是流动性,下面从这几个方面来对比一下余额宝跟P2P网贷. 首先是收益性,作为投资理财者,第一 ...

  8. 全面具体介绍一个P2P网贷领域的ERP系统的主要功能

        一般的P2P系统,至少包含PC站点的前端和后端.前端系统的功能.能够參考"P2P系统哪家强,功能事实上都一样" http://blog.csdn.net/fansunion ...

  9. 2015,我的投资理财策略(股权众筹+P2P网贷+活期理财)

    纸币流行,尤其是当今中国的市场经济,纸币几乎是一直是贬值的,每个人的财富都在被不断地稀释,可能是被政府.如果你不注意保值增值,你就越来越穷.     当年的万元户,在今天看来就是一个笑话,其实不怎么好 ...

随机推荐

  1. laravel启动过程简单解析

    :first-child{margin-top:0!important}img.plugin{box-shadow:0 1px 3px rgba(0,0,0,.1);border-radius:3px ...

  2. 工作记录之 [ python请求url ] v s [ java请求url ]

    背景: 模拟浏览器访问web,发送https请求url,为了实验需求需要获取ipv4数据包 由于不做后续的内容整理(有内部平台分析),故只要写几行代码请求发送https请求url列表中的url即可 开 ...

  3. hive提前过滤重要性

    hive提前过滤 create table sospdm.tmp_yinfei_test_01 ( id string ) partitioned by (statis_date string) ; ...

  4. notepad++ 注释

    在用notepad++进行代码编辑的过程中,总感觉还是有keil那样可以进行多行注释的快捷方式方便,其实notepad++也可以进行单行.多行.区块注释和取消注释的....... 快捷键如下: 单行. ...

  5. 表单提交和ajax提交数据的请求区别

    在http请求中,我们通常会看到请求字段以query string parameters,或form data,或request payload形式发送到服务器,究竟他们有什么区别呢?下面为您揭晓答案 ...

  6. 按字典序依次打印只由1~n组成的n位数

    //我的dfs入门.将1~n一次填入数组然后打印. #include<stdio.h> #include<string.h> ]; ]; void dfs(int,int); ...

  7. jsonp 跨域 jsonp 发音

    JSONP(JSON with Padding)是JSON的一种“使用模式” 可用于解决主流浏览器的跨域数据访问的问题. 由于同源策略, 一般来说位于 server1.example.com 的网页 ...

  8. BZOJ.4559.[JLOI2016]成绩比较(DP/容斥 拉格朗日插值)

    BZOJ 洛谷 为什么已经9点了...我写了多久... 求方案数,考虑DP... \(f[i][j]\)表示到第\(i\)门课,还有\(j\)人会被碾压的方案数. 那么\[f[i][j]=\sum_{ ...

  9. Python3之弹性力学——应力张量1

    题目 已知某点的应力张量为: \[ \left[ \begin{array}{ccc} \sigma_{x} &\tau_{xy} &\tau_{xz}\\ \tau_{yx} &am ...

  10. git rewinding head to replay your work on top of it...

    git fetch origin git reset --hard origin/<branch>