作者Toby,来源公众号:Python风控模型,金融风控行为评分卡模型
B卡介绍
在信贷业务中,评分卡分为三种:
申请评分卡(A卡)
行为评分卡(B卡)
催收评分卡(C卡)
本篇我们来学习一下行为评分卡(B卡),首先什么是行为评分卡呢,行为评分卡的使用场景以及目的,适用的信贷产品?
金融风控行为评分卡模型(B卡)的介绍如下:
-
定义:行为评分卡(B卡)是一种根据贷款人放贷后的表现行为,预测未来违约风险概率的模型
-
使用场景:B卡用于贷款发放之后、到期之前的时间段,即“贷中”环节。其主要作用是监控贷款人在贷款结束之前的逾期/违约风险,并在此基础上构建内部评级法中的PD(probability of default)模型
-
使用目的:B卡的主要目的是评估用户未来的违约风险,并根据评估结果调整用户的信用额度和利率
-
适用的信贷产品:B卡适用于还款周期长的信贷产品,如房贷、车贷、某些信用现金贷,以及循环授信类的信贷产品,如信用卡、某些信用贷
-
观察期与表现期:行为评分卡预测的是条件概率,构建和使用行为评分卡的两个时间段为观察期和表现期。观察期是当前以及过去一段时间内,用于搜集变量、特征的时间窗口,通常为1年或者半年以内;表现期是未来一段时间。
-
特征构造:B卡模型的特征构造包括还款率类型的特征、额度使用率类型的特征、逾期类型的特征等
-
模型构建:B卡模型构建时会结合A卡的特征信息,以此训练出一个更全面反映用户信用状况的模型
-
适用客群:B卡适用于老客户,即至少有一笔支用订单有三期还款表现的客户
-
模型功能:B卡在风控领域中起着违约监控与额度管理的作用。此外,在巴塞尔模型里,内部评级法模型(Internal Rating Based Model)也非常依赖于行为评分卡
-
模型性能:B卡模型性能一般显著高于A卡,金融机构在放款后能观察出客户逾期信息,如果客户在早期发生逾期,在之后也有逾期倾向,因此在观察期收集变量能让模型有较高AUC。Toby老师建模时候,很多B卡AUC高于0.8.
通过这些功能和特点,B卡能够帮助金融机构更动态地监控用户的违约风险,并适时调整用户的信用额度和利率。
其中特别注意一下,不适合先息后本的信贷产品,因为每个月的违约概率不一样,不好预测
观察期和表现期
学习行为评分卡之前,要了解一些概念,什么是观察期和表现期,什么是观察点
观察期观察的是行为,表现期预测表现好坏
P(表现期好坏/观察期行为)
这里要注意一下,假如我们定义表现坏客户为M3+,观察期时间窗口为12个月,则起码要收集12+3个月的数据
当然观察点也不宜太长,因为不到MOB的客户,不能进入行为评分卡中,会丢失大量重要数据
当此刻的时间满足了MOB但是不满足观察期,也可以构建B卡,但是有一些变量表现效果不怎么好(因为和每个变量的收集间隔有关,间隔长的变量收集得太少,表现自然不佳)
讲完了观察期和表现期,我们就来讲一下信用评分卡常用的特征构造,特征构造之前我们来学习一个定义:时间切片
特征构造
一般有以下几类特征
还款率类型的特征
额度使用率类型的特征
逾期类型的特征
这里注意一下,不能用轻度逾期去预测轻度逾期,不能用重度逾期去预测重度逾期,这里的目标变量是DPD(day past due)90,变量可以是DPD60、DPD30等
消费类型的特征(每一笔消费有具体详细可以做)
三方机构(社交数据、出行数据)
下面就来讲解一下行为评分卡建立模型的步骤(和申请评分卡差不多)
数据预处理
特征衍生
特征处理与筛选
特征挑选
变量分箱
模型的参数估计(逻辑回归模型)
添加完所有变量后,逻辑回归结果如下图所示,还是存在P值不显著情况,单独拿去这些变量一个一个与目标变量进行逻辑回归检验其显著性
也就是挑选4个GBDT模型最重要的变量进行逻辑回归后,发现其逻辑回归系数为负,之后我们按照GBDT模型变量重要性降序顺序一个一个往里面加,每加一个,进行一次逻辑回归,发现存在逻辑回归系数为正的,就可以把该变量剔除
逻辑回归要求系数为负而且P值要显著,我们使用外生模型GBDT估计模型重要性
所以,我们使用LASSO再次进行变量挑选
模型的性能测试
概率转换为分数
相关课程
目前各大金融公司为了降低风险管理,都在搭建信用风险评分卡模型。信用风险评分卡模型可以量化评估风险,避免了领导拍脑袋解决问题的尴尬。如果大家对信用风险评分卡各种细节感兴趣,欢迎大家收藏课程《python信用评分卡建模附代码》。