本来想按照实操上的建模工作顺序,从数据源计算IV和WOE值、变量筛选、逻辑回归到模型评价写这系列文章,但有读者反应读起来有些生涩无聊(请原谅笔者也是第一次写公众号啊/(ㄒoㄒ)/~~)。
于是这里插入了本篇,主要就介绍下常用的两种回归模型,从中你会知道为什么信贷风控普遍使用逻辑回归而不是我们熟悉的线性回归。希望读者看完,能对风控建模要达到的目的有一个总体的sense。
~~~~~~~~~切入正题~~~~~~~~~
一切预测模型,你都可以理解为是一个黑箱,往黑箱里输入一堆数据(自变量,或称之为特征变量),然后黑箱给你输出一堆数(应变量,或称之为被预测值、Y值)。
注:后文讲解我们先跳过后续文章会介绍的在IV和WOE值计算之后,还需进行的缺失值填充、相关分析、多重共线性分析、主成分分析等工序以筛选出最后“合格”的入模变量。假设此时我们已经完成上述过程,并获得符合标准格式的"prohibit"表以按列次存放主键、Y值和特征取值。
方法