KS值的取值范围是[0,1],一般习惯乘以100%。通常来说,KS越大,表明正负样本区分程度越好。KS的业务评价标准如下所示。由于理解因人而异,不一定完全合理,仅供参考。
Ks<0.2:区分能力弱
20
40
50
60
Ks>75:区分能力高但疑似过拟合
6 分数校准
分数校准是将模型算出来的0-1的概率值转换成整数分数,分数越高表示客户风险越低(不同业务分数范围不同,解释存在差异)。
逻辑回归的线性公式:

编辑切换为居中
添加图片注释,不超过 140 字(可选)
该公式将自变量x与y之间的非线性关系转换为线性关系。
客户的分

编辑切换为居中
添加图片注释,不超过 140 字(可选)
定义

编辑
添加图片注释,不超过 140 字(可选)
p/(1-p)表示坏好比,-b可以使得违约概率越低,分数越高:
odds>1,表示坏客户概率高于好客户概率
odds<1,表示坏客户概率低于好客户概率
odds=1,表示坏客户概率等于好客户概率
这里要做两个假设,将score公式中的A、B参数计算出来。
(1)在某个特征比例下的分数。比如,设定坏:好=1:60的时候,score=600。(这里可根据个人习惯设定比例和分数值)
(2)坏好比翻倍的分数。比如,坏:好=1:120时,分数为620,也就是比率翻倍后,分数增加20分。设为pdo。