3.2 IV
IV 称为信息值,计算公式为sum((违约件占比-正常件占比))*woe,IV值表示变量预测能力的强度。
分组i的IV值计算:
编辑
添加图片注释,不超过 140 字(可选)
总体的IV:
添加图片注释,不超过 140 字(可选)
结合上面的公式,计算如下案例:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
同时,我们需要woe具有单调性或者呈U型,否则的话,需要进行手动调整。举例如下:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
4 建模
在做完如上准备工作后,接下来要开始建模。
逻辑回归公式:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
编辑切换为居中
添加图片注释,不超过 140 字(可选)